นี่คือแหล่งข้อมูลเปิดฟรีที่ดีที่สุดที่ทุกคนสามารถใช้ได้

Open Data คืออะไร?

กล่าวง่ายๆว่า Open Data หมายถึงประเภทของข้อมูลที่เปิดให้ทุกคนและทุกคนสามารถเข้าถึงแก้ไขใช้ซ้ำและแบ่งปันได้

Open Data มาจาก“ การเคลื่อนไหวแบบเปิด” ต่างๆเช่นโอเพ่นซอร์สฮาร์ดแวร์แบบเปิดรัฐบาลเปิดวิทยาศาสตร์แบบเปิดเป็นต้น

รัฐบาลองค์กรอิสระและหน่วยงานต่างๆต่างเร่งเปิดประตูระบายข้อมูลเพื่อสร้างข้อมูลที่เปิดกว้างมากขึ้นเพื่อให้เข้าถึงได้ฟรีและง่ายดาย

เหตุใดข้อมูลเปิดจึงมีความสำคัญ

ข้อมูลแบบเปิดมีความสำคัญเนื่องจากโลกมีการขับเคลื่อนข้อมูลมากขึ้นเรื่อย ๆ แต่หากมีข้อ จำกัด ในการเข้าถึงและใช้ข้อมูลแนวคิดเรื่องธุรกิจที่ขับเคลื่อนด้วยข้อมูลและการกำกับดูแลจะไม่ปรากฏเป็นรูปธรรม

ดังนั้นข้อมูลเปิดจึงมีสถานที่เฉพาะของตัวเอง ช่วยให้เข้าใจปัญหาระดับโลกและปัญหาสากลได้อย่างเต็มที่ สามารถกระตุ้นธุรกิจได้มาก อาจเป็นแรงผลักดันที่ดีสำหรับการเรียนรู้ของเครื่อง สามารถช่วยต่อสู้กับปัญหาระดับโลกเช่นโรคภัยอาชญากรรมหรือความอดอยาก ข้อมูลเปิดสามารถเสริมพลังให้กับพลเมืองและด้วยเหตุนี้จึงสามารถเสริมสร้างประชาธิปไตย สามารถปรับปรุงกระบวนการและระบบที่สังคมและรัฐบาลได้สร้างขึ้น สามารถช่วยเปลี่ยนแปลงวิธีที่เราเข้าใจและมีส่วนร่วมกับโลกได้

นี่คือรายชื่อแหล่งข้อมูลโอเพ่นที่ยอดเยี่ยม 15 แหล่งของฉัน:

1. ข้อมูลเปิดของธนาคารโลก

ในฐานะที่เก็บข้อมูลที่ครอบคลุมมากที่สุดในโลกเกี่ยวกับสิ่งที่เกิดขึ้นในประเทศต่างๆทั่วโลก World Bank Open Data จึงเป็นแหล่งข้อมูลที่สำคัญของ Open Data นอกจากนี้ยังให้การเข้าถึงชุดข้อมูลอื่น ๆ ด้วยซึ่งระบุไว้ในแค็ตตาล็อกข้อมูล

ข้อมูลแบบเปิดของธนาคารโลกมีขนาดใหญ่มากเนื่องจากมีชุดข้อมูล 3000 ชุดและตัวบ่งชี้ 14000 ตัวซึ่งครอบคลุม microdata สถิติอนุกรมเวลาและข้อมูลภูมิสารสนเทศ

การเข้าถึงและค้นพบข้อมูลที่คุณต้องการก็ทำได้ง่ายเช่นกัน สิ่งที่คุณต้องทำคือระบุชื่อตัวบ่งชี้ประเทศหรือหัวข้อและมันจะเปิดคลังสมบัติของ Open Data สำหรับคุณ นอกจากนี้ยังช่วยให้คุณดาวน์โหลดข้อมูลในรูปแบบต่างๆเช่น CSV, Excel และ XML

หากคุณเป็นนักข่าวหรือนักวิชาการคุณจะหลงระเริงไปกับเครื่องมือมากมายที่มีให้คุณ คุณสามารถเข้าถึงเครื่องมือการวิเคราะห์และการแสดงภาพที่สามารถสนับสนุนการวิจัยของคุณ ช่วยให้เข้าใจปัญหาของโลกได้อย่างลึกซึ้งและดีขึ้น

คุณสามารถเข้าถึง API ซึ่งสามารถช่วยคุณสร้างการแสดงภาพข้อมูลที่คุณต้องการการผสมผสานแบบสดกับแหล่งข้อมูลอื่น ๆ และคุณสมบัติอื่น ๆ อีกมากมาย

ดังนั้นจึงไม่แปลกใจเลยที่ World Bank Open Data ติดอันดับต้น ๆ ของแหล่งข้อมูล Open

2. WHO (องค์การอนามัยโลก) - เปิดที่เก็บข้อมูล

ที่เก็บข้อมูลแบบเปิดของ WHO คือวิธีที่ WHO ติดตามสถิติเฉพาะด้านสุขภาพของประเทศสมาชิก 194 ประเทศ

ที่เก็บข้อมูลจะจัดระเบียบข้อมูลอย่างเป็นระบบ สามารถเข้าถึงได้ตามความต้องการที่แตกต่างกัน ตัวอย่างเช่นไม่ว่าจะเป็นการเสียชีวิตหรือเป็นภาระของโรคเราสามารถเข้าถึงข้อมูลที่จัดอยู่ใน 100 หมวดหมู่ขึ้นไปเช่นเป้าหมายการพัฒนาแห่งสหัสวรรษ (โภชนาการเด็กสุขภาพเด็กอนามัยแม่และการเจริญพันธุ์การสร้างภูมิคุ้มกันเอชไอวี / เอดส์วัณโรคมาลาเรีย โรคที่ถูกทอดทิ้งน้ำและการสุขาภิบาล) โรคไม่ติดต่อและปัจจัยเสี่ยงโรคที่มีแนวโน้มการแพร่ระบาดระบบสุขภาพอนามัยสิ่งแวดล้อมความรุนแรงและการบาดเจ็บความเท่าเทียมกันเป็นต้น

สำหรับความต้องการเฉพาะของคุณคุณสามารถดูชุดข้อมูลตามธีมหมวดหมู่ตัวบ่งชี้และประเทศ

ข้อดีคือสามารถดาวน์โหลดข้อมูลที่ต้องการในรูปแบบ Excel ได้ คุณยังสามารถตรวจสอบและวิเคราะห์ข้อมูลโดยใช้พอร์ทัลข้อมูล

นอกจากนี้ยังมี API ไปยังเนื้อหาข้อมูลและสถิติขององค์การอนามัยโลก

3. Google Public Data Explorer

Google Public Data Explorer เปิดตัวในปี 2010 สามารถช่วยคุณสำรวจชุดข้อมูลสาธารณะประโยชน์จำนวนมหาศาล คุณสามารถแสดงภาพและสื่อสารข้อมูลสำหรับการใช้งานตามลำดับ

ทำให้ข้อมูลจากหน่วยงานและแหล่งข้อมูลต่างๆพร้อมใช้งาน ตัวอย่างเช่นคุณสามารถเข้าถึงข้อมูลจากธนาคารโลกสำนักงานสถิติแรงงานสหรัฐและสำนักงานสหรัฐ OECD IMF และอื่น ๆ

ผู้มีส่วนได้ส่วนเสียที่แตกต่างกันเข้าถึงข้อมูลนี้ด้วยวัตถุประสงค์ที่หลากหลาย ไม่ว่าคุณจะเป็นนักเรียนหรือนักข่าวไม่ว่าคุณจะเป็นผู้กำหนดนโยบายหรือนักวิชาการคุณสามารถใช้ประโยชน์จากเครื่องมือนี้เพื่อสร้างภาพข้อมูลสาธารณะได้

คุณสามารถปรับใช้วิธีต่างๆในการแสดงข้อมูลเช่นกราฟเส้นกราฟแท่งแผนที่และแผนภูมิฟองด้วยความช่วยเหลือของ Data Explorer

ส่วนที่ดีที่สุดคือคุณจะพบว่าการแสดงภาพเหล่านี้ค่อนข้างมีชีวิตชีวา หมายความว่าคุณจะเห็นสิ่งเหล่านี้เปลี่ยนแปลงไปตามกาลเวลา คุณสามารถเปลี่ยนหัวข้อมุ่งเน้นไปที่รายการต่างๆและปรับเปลี่ยนมาตราส่วนได้

แชร์ได้ง่ายด้วย ทันทีที่คุณเตรียมแผนภูมิให้พร้อมคุณสามารถฝังไว้ในเว็บไซต์หรือบล็อกของคุณหรือเพียงแค่แชร์ลิงก์กับเพื่อนของคุณ

4. Registry of Open Data บน AWS (RODA)

นี่คือที่เก็บที่มีชุดข้อมูลสาธารณะ เป็นข้อมูลที่มีให้จากทรัพยากรของ AWS

เท่าที่เกี่ยวข้องกับ RODA คุณสามารถค้นพบและแบ่งปันข้อมูลที่เปิดเผยต่อสาธารณะได้

ใน RODA คุณสามารถใช้คีย์เวิร์ดและแท็กสำหรับข้อมูลประเภททั่วไปเช่นจีโนมภาพถ่ายดาวเทียมและการขนส่งเพื่อค้นหาข้อมูลใด ๆ ที่คุณกำลังมองหา ทั้งหมดนี้สามารถทำได้บนเว็บอินเตอร์เฟสที่เรียบง่าย

สำหรับชุดข้อมูลทั้งหมดคุณจะพบหน้ารายละเอียดตัวอย่างการใช้งานข้อมูลใบอนุญาตและบทช่วยสอนหรือแอปพลิเคชันที่ใช้ข้อมูลนี้

ด้วยการใช้ผลิตภัณฑ์การประมวลผลและการวิเคราะห์ข้อมูลที่หลากหลายคุณสามารถวิเคราะห์ข้อมูลแบบเปิดและสร้างบริการใดก็ได้ที่คุณต้องการ

แม้ว่าข้อมูลที่คุณเข้าถึงจะพร้อมใช้งานผ่านทรัพยากรของ AWS แต่คุณต้องจำไว้ว่า AWS ไม่ได้จัดเตรียมไว้ให้ ข้อมูลนี้เป็นของหน่วยงานองค์กรของรัฐนักวิจัยธุรกิจและบุคคลต่างๆ

5. พอร์ทัลข้อมูลแบบเปิดของสหภาพยุโรป

คุณสามารถเข้าถึงข้อมูลแบบเปิดได้ทุกสถาบันของสหภาพยุโรปหน่วยงานและองค์กรอื่น ๆ ที่เผยแพร่บนแพลตฟอร์มเดียว ได้แก่ European Union Open Data Portal

EU Open Data Portal เป็นที่ตั้งของข้อมูลเปิดที่สำคัญที่เกี่ยวข้องกับโดเมนนโยบายของสหภาพยุโรป โดเมนนโยบายเหล่านี้ ได้แก่ เศรษฐกิจการจ้างงานวิทยาศาสตร์สิ่งแวดล้อมและการศึกษา

สถาบันองค์กรหรือหน่วยงานในสหภาพยุโรปราว 70 แห่งเช่น Eurostat, European Environment Agency, Joint Research Center และ European Commission Directorates General และ EU Agencies อื่น ๆ ได้กำหนดให้ชุดข้อมูลของตนเป็นสาธารณะและอนุญาตให้เข้าถึง ชุดข้อมูลเหล่านี้มีจำนวนเกิน 11700 จนถึงปัจจุบัน

พอร์ทัลช่วยให้เข้าถึงได้ง่าย คุณสามารถค้นหาสำรวจเชื่อมโยงดาวน์โหลดและนำข้อมูลกลับมาใช้ใหม่ได้อย่างง่ายดายผ่านทางแคตตาล็อกของข้อมูลเมตาทั่วไป คุณสามารถทำได้เพื่อวัตถุประสงค์เฉพาะของคุณ อาจเป็นวัตถุประสงค์ทางการค้าหรือไม่ใช่เชิงพาณิชย์

คุณสามารถค้นหาแค็ตตาล็อกข้อมูลเมตาผ่านเครื่องมือค้นหาแบบโต้ตอบ (แท็บข้อมูล) และแบบสอบถาม SPARQL (แท็บข้อมูลที่เชื่อมโยง)

ด้วยการใช้แคตตาล็อกนี้คุณสามารถเข้าถึงข้อมูลที่จัดเก็บไว้ในเว็บไซต์ต่างๆของสถาบันหน่วยงานและองค์กรของสหภาพยุโรป

6. FiveThirtyEight

เป็นเว็บไซต์ที่ยอดเยี่ยมสำหรับการสื่อสารมวลชนที่ขับเคลื่อนด้วยข้อมูลและการเล่าเรื่อง

เป็นแหล่งข้อมูลที่หลากหลายสำหรับภาคส่วนต่างๆเช่นการเมืองกีฬาวิทยาศาสตร์เศรษฐศาสตร์เป็นต้นคุณสามารถดาวน์โหลดข้อมูลได้เช่นกัน

เมื่อคุณเข้าถึงข้อมูลคุณจะพบคำอธิบายสั้น ๆ เกี่ยวกับชุดข้อมูลแต่ละชุดตามแหล่งที่มา นอกจากนี้คุณยังจะได้รับรู้ว่ามันหมายถึงอะไรและใช้อย่างไร

ในการแสดงผลข้อมูลนี้เป็นมิตรกับผู้ใช้ชุดข้อมูลจะจัดเตรียมชุดข้อมูลในรูปแบบที่เรียบง่ายและไม่เป็นกรรมสิทธิ์เช่นไฟล์ CSV ไม่จำเป็นต้องพูดว่ารูปแบบเหล่านี้สามารถเข้าถึงและประมวลผลได้ง่ายโดยมนุษย์และเครื่องจักร

ด้วยความช่วยเหลือของชุดข้อมูลเหล่านี้คุณสามารถสร้างเรื่องราวและการแสดงภาพตามความต้องการและความชอบของคุณเอง

7. สำนักสำรวจสำมะโนประชากรของสหรัฐฯ

US Census Bureau เป็นหน่วยงานด้านสถิติที่ใหญ่ที่สุดของรัฐบาลกลาง จัดเก็บและให้ข้อเท็จจริงและข้อมูลที่เชื่อถือได้เกี่ยวกับบุคคลสถานที่และเศรษฐกิจของอเมริกา

สำนักสำรวจสำมะโนประชากรถือว่าภารกิจอันสูงส่งในการขยายบริการในฐานะผู้ให้บริการข้อมูลคุณภาพที่น่าเชื่อถือที่สุด

ไม่ว่าจะเป็นรัฐบาลกลางของรัฐท้องถิ่นหรือชนเผ่าทั้งหมดนี้ใช้ประโยชน์จากข้อมูลสำมะโนประชากรเพื่อวัตถุประสงค์ที่หลากหลาย รัฐบาลเหล่านี้ใช้ข้อมูลนี้เพื่อระบุที่ตั้งของที่อยู่อาศัยใหม่และสิ่งอำนวยความสะดวกสาธารณะ พวกเขายังใช้ประโยชน์จากการตรวจสอบลักษณะทางประชากรของชุมชนรัฐและสหรัฐอเมริกา

ข้อมูลนี้ยังใช้ในการวางแผนระบบขนส่งและถนน เมื่อต้องพิจารณากำหนดโควตาและสร้างตำรวจและเขตดับเพลิงข้อมูลนี้มีประโยชน์ เมื่อรัฐบาลสร้างพื้นที่การเลือกตั้งโรงเรียนสาธารณูปโภค ฯลฯ พวกเขาใช้ประโยชน์จากข้อมูลนี้ เป็นการรวบรวมข้อมูลประชากรหนึ่งครั้งต่อทศวรรษและข้อมูลนี้มีประโยชน์มากในการทำสิ่งเดียวกันให้สำเร็จ

มีเครื่องมือต่างๆเช่น American Fact Finder, Census Data Explorer และ Quick Facts ซึ่งมีประโยชน์ในกรณีที่คุณต้องการค้นหาปรับแต่งและแสดงภาพข้อมูล

ตัวอย่างเช่น Quick Facts เพียงอย่างเดียวมีสถิติสำหรับรัฐมณฑลเมืองและแม้แต่เมืองทั้งหมดที่มีประชากร 5,000 คนขึ้นไป

ในทำนองเดียวกัน American Fact Finder สามารถช่วยให้คุณค้นพบข้อเท็จจริงที่เป็นที่นิยมเช่นจำนวนประชากรรายได้เป็นต้นโดยให้ข้อมูลที่มีการร้องขอบ่อยครั้ง

สิ่งที่ดีคือคุณสามารถค้นหาโต้ตอบกับข้อมูลทำความรู้จักกับสถิติยอดนิยมและดูแผนภูมิที่เกี่ยวข้องผ่าน Census Data Explorer นอกจากนี้คุณยังสามารถใช้เครื่องมือภาพเพื่อปรับแต่งข้อมูลบนประสบการณ์แผนที่เชิงโต้ตอบ

8. Data.gov

Data.gov คือขุมทรัพย์ของข้อมูลเปิดของรัฐบาลสหรัฐฯ เมื่อไม่นานมานี้มีการตัดสินใจให้ข้อมูลทั้งหมดของรัฐบาลฟรี

เมื่อเปิดตัวมีเพียง 47 ชุดตอนนี้มี 180,000 ชุดข้อมูล

เหตุใด Data.gov จึงเป็นแหล่งข้อมูลที่ยอดเยี่ยมเนื่องจากคุณสามารถค้นหาข้อมูลเครื่องมือและทรัพยากรที่คุณสามารถปรับใช้เพื่อวัตถุประสงค์ที่หลากหลาย คุณสามารถทำการวิจัยพัฒนาเว็บและแอปพลิเคชันมือถือและแม้แต่ออกแบบการแสดงข้อมูล

สิ่งที่คุณต้องทำคือป้อนคำสำคัญในช่องค้นหาและเรียกดูประเภทแท็กรูปแบบกลุ่มประเภทองค์กรองค์กรและหมวดหมู่ สิ่งนี้จะอำนวยความสะดวกในการเข้าถึงข้อมูลหรือชุดข้อมูลที่คุณต้องการ

Data.gov เป็นไปตาม Project Open Data Schema - ชุดของฟิลด์ที่จำเป็น (Title, Description, Tags, Last Update, Publisher, Contact Name, etc. ) สำหรับทุกชุดข้อมูลที่แสดงบน Data.gov

9. DBpedia

อย่างที่ทราบกันดีว่า Wikipedia เป็นแหล่งข้อมูลชั้นยอด DBpedia มีเป้าหมายในการรับเนื้อหาที่มีโครงสร้างจากข้อมูลที่มีค่าที่ Wikipedia สร้างขึ้น

ด้วย DBpedia คุณสามารถค้นหาและสำรวจความสัมพันธ์และคุณสมบัติของทรัพยากร Wikipedia ได้อย่างมีความหมาย ซึ่งรวมถึงลิงก์ไปยังชุดข้อมูลอื่น ๆ ที่เกี่ยวข้องด้วย

มีประมาณ 4.58 ล้านเอนทิตีในชุดข้อมูล DBpedia 4.22 ล้านคนจัดอยู่ในประเภท ontology รวม 1,445,000 คน 735,000 แห่งอัลบั้มเพลง 123,000 เรื่องภาพยนตร์ 87,000 เรื่องวิดีโอเกม 19,000 องค์กร 241,000 องค์กร 251,000 ชนิดและ 6,000 โรค

มีป้ายกำกับและบทคัดย่อสำหรับเอนทิตีเหล่านี้ใน 125 ภาษา มีลิงก์ไปยังรูปภาพ 25.2 ล้านลิงก์ มีลิงก์ไปยังหน้าเว็บภายนอก 29.8 ล้านลิงก์

สิ่งที่คุณต้องทำเพื่อใช้ DBpedia คือเขียนแบบสอบถาม SPARQL กับปลายทางหรือโดยการดาวน์โหลดทิ้ง

DBpedia เป็นประโยชน์ต่อองค์กรหลายแห่งเช่น Apple (ผ่าน Siri), Google (ผ่าน Freebase และ Google Knowledge Graph) และ IBM (ผ่านวัตสัน) และโดยเฉพาะอย่างยิ่งโครงการอันทรงเกียรติที่เกี่ยวข้องกับปัญญาประดิษฐ์

10. freeCodeCamp เปิดข้อมูล

เป็นชุมชนโอเพ่นซอร์ส เหตุใดจึงสำคัญเพราะช่วยให้คุณเขียนโค้ดสร้างโปรเจ็กต์โปรโบโนหลังองค์กรไม่แสวงหาผลกำไรและคว้างานในตำแหน่งนักพัฒนา

เพื่อให้สิ่งนี้เกิดขึ้นชุมชน freeCodeCamp.org จึงมีข้อมูลจำนวนมหาศาลทุกเดือน พวกเขาได้เปลี่ยนเป็นข้อมูลเปิด

คุณจะพบสิ่งต่างๆมากมายในที่เก็บนี้ คุณสามารถค้นหาชุดข้อมูลการวิเคราะห์โครงการเดียวกันและแม้แต่การสาธิตโครงการตามข้อมูล freeCodeCamp คุณยังสามารถค้นหาลิงก์ไปยังโครงการภายนอกที่เกี่ยวข้องกับข้อมูล freeCodeCamp

สามารถช่วยคุณในโครงการและงานต่างๆที่คุณอาจคิดไว้ ไม่ว่าจะเป็นการวิเคราะห์เว็บการวิเคราะห์โซเชียลมีเดียการวิเคราะห์เครือข่ายสังคมการวิเคราะห์การศึกษาการสร้างภาพข้อมูลการพัฒนาเว็บที่ขับเคลื่อนด้วยข้อมูลหรือบอทข้อมูลที่ชุมชนนี้นำเสนอจะมีประโยชน์และมีประสิทธิผลอย่างยิ่ง

11. Yelp เปิดชุดข้อมูล

โดยพื้นฐานแล้วชุดข้อมูล Yelp นั้นเป็นส่วนย่อยของธุรกิจของเราเองบทวิจารณ์และข้อมูลผู้ใช้สำหรับใช้ในกิจกรรมส่วนตัวการศึกษาและการศึกษา

มีรีวิว 5,996,996 รายการธุรกิจ 188,593 ภาพ 280,991 ภาพและพื้นที่เมืองใหญ่ 10 แห่งรวมอยู่ใน Yelp Open Datasets

คุณสามารถใช้เพื่อวัตถุประสงค์ที่แตกต่างกัน เนื่องจากมีให้ใช้งานเป็นไฟล์ JSON คุณจึงสามารถใช้เพื่อสอนนักเรียนเกี่ยวกับฐานข้อมูลได้ คุณสามารถใช้เพื่อเรียนรู้ NLP หรือตัวอย่างข้อมูลการผลิตในขณะที่คุณเข้าใจวิธีออกแบบแอปบนอุปกรณ์เคลื่อนที่

ในชุดข้อมูลนี้คุณจะพบไฟล์แต่ละไฟล์ประกอบด้วยประเภทออบเจ็กต์เดียวคือ JSON-object 1 รายการต่อบรรทัด

12. ชุดข้อมูลของยูนิเซฟ

เนื่องจากยูนิเซฟมีความกังวลเกี่ยวกับประเด็นสำคัญที่หลากหลายจึงได้รวบรวมข้อมูลที่เกี่ยวข้องเกี่ยวกับการศึกษาการใช้แรงงานเด็กความพิการของเด็กการตายของเด็กการเสียชีวิตของมารดาน้ำและการสุขาภิบาลน้ำหนักแรกเกิดต่ำการฝากครรภ์ปอดบวมมาลาเรียการขาดสารไอโอดีน ความผิดปกติการตัด / ตัดอวัยวะเพศหญิงและวัยรุ่น

ชุดข้อมูลแบบเปิดของ UNICEF ที่เผยแพร่บน IATI Registry: //www.iatiregistry.org/publisher/unicef ​​ได้รับการดึงข้อมูลโดยตรงจากระบบปฏิบัติการ (VISION) และระบบข้อมูลอื่น ๆ ของ UNICEF และสะท้อนถึงข้อมูลที่จัดทำโดยสำนักงาน UNICEF แต่ละแห่ง

สิ่งที่ดีคือมีการอัปเดตเป็นประจำเมื่อพูดถึงชุดข้อมูลเหล่านี้ ทุกเดือนข้อมูลจะได้รับการอัปเดตเพื่อให้ครอบคลุมเชื่อถือได้และถูกต้องมากขึ้น

คุณสามารถเข้าถึงข้อมูลนี้ได้อย่างอิสระและง่ายดาย ในการดำเนินการดังกล่าวคุณสามารถดาวน์โหลดข้อมูลนี้ในรูปแบบ CSV คุณยังสามารถดูตัวอย่างข้อมูลก่อนดาวน์โหลดได้อีกด้วย

ในขณะที่ทุกคนสามารถสำรวจและเห็นภาพชุดข้อมูลของยูนิเซฟได้ แต่มีผู้เผยแพร่หลักสามราย:

ความปลอดภัยของ UNICEF's AID TRANSPARENCY PORTAL: คุณสามารถเข้าถึงชุดข้อมูลได้ง่ายขึ้นหากคุณใช้พอร์ทัลนี้ นอกจากนี้ยังมีรายละเอียดของแต่ละประเทศที่ยูนิเซฟทำงานอยู่

ผู้เผยแพร่ d-portal: ขณะนี้อยู่ใน BETA ด้วยพอร์ทัลนี้คุณสามารถสำรวจข้อมูล IATI

คุณสามารถค้นหาข้อมูลที่เกี่ยวข้องกับกิจกรรมการพัฒนางบประมาณ ฯลฯ คุณสามารถสำรวจข้อมูลนี้ได้อย่างชาญฉลาด

แพลตฟอร์มข้อมูลของผู้เผยแพร่: บนแพลตฟอร์มนี้คุณสามารถเข้าถึงสถิติแผนภูมิและเมตริกเกี่ยวกับข้อมูลที่เข้าถึงผ่าน IATI Registry ได้อย่างง่ายดาย หากคุณคลิกที่ส่วนหัวคุณยังสามารถจัดเรียงตารางจำนวนมากที่คุณเห็นบนแพลตฟอร์มได้ คุณจะพบชุดข้อมูลจำนวนมากในแพลตฟอร์มในรูปแบบ JSON ที่เครื่องอ่านได้

13. Kaggle

Kaggle นั้นยอดเยี่ยมมากเพราะมันส่งเสริมการใช้รูปแบบการเผยแพร่ชุดข้อมูลที่แตกต่างกัน อย่างไรก็ตามส่วนที่ดีกว่าคือขอแนะนำอย่างยิ่งให้ผู้เผยแพร่ชุดข้อมูลแชร์ข้อมูลของตนในรูปแบบที่เข้าถึงได้และไม่ใช่กรรมสิทธิ์

แพลตฟอร์มรองรับรูปแบบข้อมูลที่เปิดและเข้าถึงได้ สิ่งสำคัญไม่ใช่แค่สำหรับการเข้าถึง แต่ยังรวมถึงสิ่งที่คุณต้องการทำกับข้อมูลนี้ด้วย ดังนั้น Kaggle Dataset จึงกำหนดรูปแบบไฟล์อย่างชัดเจนซึ่งแนะนำให้ใช้ในขณะแชร์ข้อมูล

สิ่งที่เป็นเอกลักษณ์ของชุดข้อมูล Kaggle ก็คือไม่ใช่แค่ที่เก็บข้อมูลเท่านั้น ชุดข้อมูลแต่ละชุดหมายถึงชุมชนที่ช่วยให้คุณสามารถอภิปรายข้อมูลค้นหารหัสสาธารณะและเทคนิคและกำหนดแนวคิดโครงการของคุณใน Kernels

CSV, JSON, SQLite, Archive, Big Query ฯลฯ เป็นประเภทไฟล์ที่ Kaggle รองรับ คุณสามารถค้นหาแหล่งข้อมูลที่หลากหลายเพื่อเริ่มทำงานในโครงการข้อมูลแบบเปิดของคุณ

ส่วนที่ดีที่สุดคือ Kaggle อนุญาตให้คุณเผยแพร่และแบ่งปันชุดข้อมูลแบบส่วนตัวหรือแบบสาธารณะ

14. LODUM

เป็นโครงการริเริ่ม Open Data ของ University of Münster ภายใต้การริเริ่มนี้ทำให้ทุกคนสามารถเข้าถึงข้อมูลสาธารณะเกี่ยวกับมหาวิทยาลัยในรูปแบบที่เครื่องอ่านได้ คุณสามารถเข้าถึงและนำกลับมาใช้ใหม่ได้ง่ายตามความต้องการของคุณ

เปิดข้อมูลเกี่ยวกับสิ่งประดิษฐ์ทางวิทยาศาสตร์และเข้ารหัสเป็นข้อมูลที่เชื่อมโยงอยู่ภายใต้โครงการนี้

ด้วยความช่วยเหลือของข้อมูลที่เชื่อมโยงทำให้สามารถแบ่งปันและใช้ข้อมูลออนโทโลยีและมาตรฐานข้อมูลเมตาต่างๆ ตามความเป็นจริงแล้วคาดการณ์ว่าจะเป็นมาตรฐานที่ยอมรับในการให้ข้อมูลเมตาและข้อมูลบนเว็บ

ทีม LODUM ได้ร่วมกันริเริ่ม LinkedUniversities.org และ LinkedScience.org

คุณสามารถใช้โปรแกรมแก้ไข SPARQL หรือแพ็คเกจ SPARQL ของ R เพื่อวิเคราะห์ข้อมูล

SPARQL Package ช่วยให้สามารถเชื่อมต่อกับปลายทาง SPARQL ผ่าน HTTP สร้างแบบสอบถาม SELECT หรือแบบสอบถามการอัปเดต (LOAD, INSERT, DELETE)

15. UCI Machine Learning Repository

ทำหน้าที่เป็นที่เก็บฐานข้อมูลทฤษฎีโดเมนและตัวสร้างข้อมูลที่ครอบคลุมซึ่งชุมชนแมชชีนเลิร์นนิงใช้สำหรับการวิเคราะห์เชิงประจักษ์ของอัลกอริทึมการเรียนรู้ของเครื่อง

ในที่เก็บนี้ปัจจุบันมีชุดข้อมูล 463 ชุดเพื่อให้บริการแก่ชุมชนแมชชีนเลิร์นนิง

ศูนย์การเรียนรู้ของเครื่องและระบบอัจฉริยะที่มหาวิทยาลัยแคลิฟอร์เนียเออร์ไวน์เป็นเจ้าภาพและดูแลระบบดังกล่าว David Aha ได้สร้างมันขึ้นครั้งแรกเมื่อเป็นนักศึกษาระดับบัณฑิตศึกษาที่ UC Irvine

ตั้งแต่นั้นเป็นต้นมานักเรียนนักการศึกษาและนักวิจัยทั่วโลกใช้ประโยชน์จากข้อมูลนี้เป็นแหล่งข้อมูลที่เชื่อถือได้ของชุดข้อมูลแมชชีนเลิร์นนิง

วิธีการทำงานคือชุดข้อมูลแต่ละชุดมีหน้าเว็บที่แตกต่างกันซึ่งรวบรวมรายละเอียดที่ทราบทั้งหมดรวมถึงสิ่งพิมพ์ที่เกี่ยวข้องที่ตรวจสอบ คุณสามารถดาวน์โหลดชุดข้อมูลเหล่านี้เป็นไฟล์ ASCII ซึ่งมักเป็นรูปแบบ CSV ที่มีประโยชน์

รายละเอียดของชุดข้อมูลสรุปตามลักษณะต่างๆเช่นประเภทแอตทริบิวต์จำนวนอินสแตนซ์จำนวนแอตทริบิวต์และปีที่เผยแพร่ซึ่งสามารถจัดเรียงและค้นหาได้

เปิดพอร์ทัลข้อมูลและเครื่องมือค้นหา:

แม้ว่าจะมีชุดข้อมูลมากมายที่เผยแพร่โดยหน่วยงานต่างๆทุกปี แต่ชุดข้อมูลเพียงไม่กี่ชุดก็ได้รับการยอมรับและจัดตั้ง

เหตุผลที่ชุดข้อมูลดังกล่าวมีเพียงไม่กี่ชุดเท่านั้นที่ยังคงอยู่ในฐานะทรัพยากรที่มีประโยชน์ก็คือความท้าทายในการพัฒนาจัดการและจัดหาข้อมูลในแบบที่ผู้คนและองค์กรพบว่ามีประโยชน์และใช้งานง่าย

อย่างไรก็ตามโปรดดูรายชื่อพอร์ทัลและแพลตฟอร์มข้อมูลแบบเปิดที่สำคัญอื่น ๆ ด้านล่างซึ่งอนุญาตให้ผู้ใช้เข้าถึงข้อมูลแบบเปิดได้ค่อนข้างง่ายศึกษาผลกระทบและรวบรวมข้อมูลเชิงลึกที่มีค่า

  1. การค้นหาชุดข้อมูลของ Google
  2. Dataverse
  3. เปิด Data Kit
  4. Ckan
  5. เปิด Data Monitor
  6. Plenar.io
  7. เปิดแผนที่ผลกระทบข้อมูล

สรุป

เปิดข้อมูลคือลำดับของวัน โลกค่อยๆเริ่มเคลื่อนไปสู่ระบบเปิดและข้อมูลแบบเปิดก็ซิงค์กันอย่างถูกต้อง

ธุรกิจและองค์กรที่ใช้ประโยชน์จากข้อมูลแบบเปิดจะได้เปรียบในการแข่งขันและจะสามารถครองอำนาจในอนาคต