การวิเคราะห์ข้อมูลขนาดใหญ่ได้สนับสนุนความสามารถที่สำคัญในด้านฟิสิกส์และดาราศาสตร์ มาอย่างยาวนาน แต่เมื่อเร็ว ๆ นี้เราได้เห็นว่ามันสนับสนุนความก้าวหน้าทางสังคมศาสตร์และมนุษยศาสตร์
นับตั้งแต่ตีพิมพ์บทความComputational Social Scienceในปี 2009 เครื่องมือวิเคราะห์ข้อมูลรุ่นใหม่ได้ให้ข้อมูลเชิงลึกแก่นักวิจัยเกี่ยวกับคำถามพื้นฐานเกี่ยวกับวิธีที่เราสื่อสาร เราคือใคร และสิ่งที่เราให้ความสำคัญ ตัวอย่างเช่น โดยการวิเคราะห์ความถี่สัมพัทธ์ของคำบางคำในตำราประวัติศาสตร์ นักวิจัยสามารถ
ระบุการเปลี่ยนแปลงที่สำคัญในการใช้ภาษาของเราเมื่อเวลาผ่านไป
ในบางกรณี การเปลี่ยนแปลงเหล่านี้จะเห็นได้ชัด เช่น การใช้คำโบราณที่ถูกแทนที่ด้วยคำร่วมสมัย แต่ในกรณีอื่นๆ อาจสะท้อนถึงการเปลี่ยนแปลงทางสังคมและวัฒนธรรมที่ลึกซึ้งแต่กว้างขวาง ด้านล่างนี้คือการค้นพบที่เน้นข้อมูลเป็นศูนย์กลางที่มีอิทธิพลมากที่สุดในช่วง 10 ปีที่ผ่านมา
วิธีที่เราสื่อสาร
ในช่วงทศวรรษที่ผ่านมา แหล่งข้อมูลเปิดทั่วโลกจำนวนมากขึ้นช่วยให้นักวิจัยเปิดเผยรูปแบบในสิ่งที่เราอ่าน เขียน และให้ความสนใจ Google Books, WorldcatและProject Gutenbergเป็นเพียงตัวอย่างบางส่วนเท่านั้น
การเปิดตัวโปรแกรมดู n-gram ของ Google หนังสือ ในช่วงต้นปี 2010 เป็นตัวเปลี่ยนเกมในด้านนี้ เครื่องมือนี้ใช้ฐานข้อมูล Google หนังสือทั้งหมดเพื่อแสดงความถี่สัมพัทธ์ของคำหรือวลีหนึ่งๆ ที่ใช้กันมานานหลายร้อยปี นักวิจัยได้ใช้ข้อมูลนี้เพื่อสำรวจการระงับการกล่าวถึงจิตรกรชาวยิวอย่างเช่น Marc Chagall ในหนังสือภาษาเยอรมันในช่วงสงครามโลกครั้งที่สองอย่างเป็นระบบ
การวิเคราะห์ข้อมูลยังสามารถเปิดเผยรูปแบบในการแสดงออกของอารมณ์ของมนุษย์เมื่อเวลาผ่านไป We Feelของ CSIRO ติดตามอารมณ์ความรู้สึกในชุมชนต่างๆ ทั่วโลก ทำสิ่งนี้โดยวิเคราะห์ภาษาที่ผู้คนใช้บนโซเชียลมีเดียแบบเรียลไทม์และทำแผนที่
เครื่องมือนี้สามารถใช้เพื่อกำหนดอารมณ์ทั่วไปเมื่อเวลาผ่านไป (ชั่วโมงต่อชั่วโมง วันต่อวัน) ภายในเมืองและประเทศใดประเทศหนึ่ง จากนั้นสามารถสำรวจรูปแบบในข้อมูลเหล่านี้ร่วมกับข้อมูลอื่นๆ เช่น สภาพอากาศ วันหยุด และความผันผวนทางเศรษฐกิจ ผลการวิจัยบางชิ้นอ้างว่าแสดงถึงการเปลี่ยนแปลงพื้นฐานในคุณค่าทางสังคมของมนุษย์ ความรู้สึกนึกคิดของชุมชน และวิธีคิดของเรา (ตัวอย่างเช่น การขึ้น
และลงของคำที่เกี่ยวข้องกับความเป็นเหตุเป็นผล เช่น “วิธีการ”
“การวิเคราะห์” และ “การกำหนด”) นี่คือข้อค้นพบที่สำคัญบางประการในพื้นที่นี้ การหมุนเวียนทางวัฒนธรรมกำลังเร่งตัวขึ้น
การวิเคราะห์ที่นำโดยมหาวิทยาลัยฮาร์วาร์ดซึ่งมีข้อมูลมากกว่าหนึ่งศตวรรษจากหนังสือหลายล้านเล่มแสดงหลักฐานว่าช่วงความสนใจของสังคมที่มีต่อเหตุการณ์ทางประวัติศาสตร์กำลังลดลง ขณะที่ความต้องการเนื้อหาใหม่ๆ เพิ่มขึ้น
กล่าวอีกนัยหนึ่งเรากำลังลืมอดีตเร็วขึ้น คุณสามารถดูข้อมูลนี้ได้ในกราฟด้านล่าง ซึ่งจะติดตามว่ามีการกล่าวถึงปีที่เฉพาะเจาะจงสามปีในวรรณกรรมหลากหลายประเภทในช่วงเวลาต่างๆ บ่อยเพียงใด เมื่อเวลาผ่านไป “ครึ่งชีวิต” ของแต่ละปี (จุดที่ได้รับความสนใจเพียงครึ่งหนึ่งที่จุดสูงสุด) มาเร็วขึ้น
ความหลากหลายทางภาษาของมนุษย์และความหลากหลายทางชีวภาพมีความสัมพันธ์กัน
จากการทำแผนที่ความหลากหลายทางภาษาและความหลากหลายของสายพันธุ์สัตว์ นักวิจัยได้แสดงให้เห็นว่าโลกทั้งสองนี้มีความสัมพันธ์กันทางภูมิศาสตร์ – ทั้งสองเพิ่มขึ้นตามอุณหภูมิและความใกล้เคียงกับเส้นศูนย์สูตร ดังนั้นยิ่งคุณเข้าใกล้เส้นศูนย์สูตรมากเท่าไหร่ ภาษาพูดก็จะยิ่งมีความหลากหลายมากขึ้นเท่านั้น
ผู้เขียนเสนอว่านี่เป็นเพราะความร้อนใกล้เส้นศูนย์สูตรทำให้เกิดผลผลิตมากขึ้นและความหลากหลายของชีวิตพืช ซึ่งทำให้เกิดสภาพแวดล้อมที่ซับซ้อนและมีการโต้ตอบมากขึ้นสำหรับทั้งสัตว์และมนุษย์ ป้อนเข้าสู่วงจรที่ “ความหลากหลายทำให้เกิดความหลากหลายมากขึ้น”
ในบทความที่ตีพิมพ์ในเดือนธันวาคม นักวิจัยใช้การเรียนรู้ของเครื่องเพื่อแสดงการเปลี่ยนแปลงในระยะยาวและสอดคล้องกันในการใช้ภาษาของเรา โดยเฉพาะอย่างยิ่ง พวกเขาเปิดเผยจุดเปลี่ยนในช่วงปี 1980 ซึ่งมีการเปลี่ยนแปลงไปสู่ภาษาที่ถือเอาตนเองเป็นศูนย์กลาง อารมณ์ และควรจะใช้เหตุผลน้อยลง
ผู้เขียนเสนอว่า (แม้ว่าจะไม่ใช่โดยไม่มีการแข่งขัน ) สิ่งนี้อาจเป็นสัญญาณเริ่มต้นของ “ยุคหลังความจริง”
พวกเราคือใคร
ในสาขาจิตวิทยา เครื่องมือวิเคราะห์ข้อมูลแบบเดียวกันนี้แสดงให้เห็นว่าบุคลิกภาพของผู้คนสามารถวัดได้โดยใช้ลักษณะนิสัยแบบ “5 ประการ” ซึ่งส่วนใหญ่จะคงที่ในวัยผู้ใหญ่
สิ่งนี้เกิดขึ้นได้ด้วยชุดข้อมูลที่กว้างขวาง เช่น HILDA ในออสเตรเลีย, German Socio-Economic Panel ในเยอรมนี และ British Household Panel Survey ในสหราชอาณาจักร
การศึกษาที่มีประสิทธิภาพยังแสดงให้เห็นว่าลักษณะบุคลิกภาพสามารถทำนายได้อย่าง น่าเชื่อถือและแม่นยำจากแหล่งข้อมูลที่หลากหลาย รวมทั้งการบันทึกเสียงรูปแบบการใช้โทรศัพท์มือถือและแม้แต่ภาพถ่ายบุคคล