การค้นหาข้อมูลจากอินเทอร์เน็ต

อินเทอร์เน็ตเกิดขึ้นในปี ค.ศ. 1969 (พ.ศ. 2512) จากการเกิดเครือข่าย ARPANET (Advanced Research Projects Agency Network) ซึ่งเป็นเครือข่ายสำนักงานโครงการวิจัยชั้นสูงของกระทรวงกลาโหม ประเทศสหรัฐอเมริกา โดยมีวัตถุประสงค์หลักของการสร้างเครือข่าย เพื่อให้คอมพิวเตอร์สามารถเชื่อมต่อและมีปฏิสัมพันธ์กันได้ เครือข่าย ARPANET ถือเป็นเครือข่ายเริ่มแรก ซึ่งต่อมาได้ถูกพัฒนาให้เป็นเครือข่ายอินเทอร์เน็ตในปัจจุบัน

หน่วยงานที่มีหน้าที่รับผิดชอบเกี่ยวกับพัฒนาอินเทอร์เน็ต

1. สมาคมอินเทอร์เน็ตหรือไอซ็อก (ISOC : Internet Society) เป็นองค์กรระหว่างประเทศไม่มุ่งเน้นผลกำไรและมีนโยบายสนับสนุนการใช้อินเทอร์เน็ตให้แพร่หลาย

2. ไอเอบี (IAB : Internet Architecture Board) มีหน้าที่ผลักดันและดูแลพัฒนาการด้านเทคนิคของอินเทอร์เน็ตให้กับไอซ็อก

3. ICANN (Internet Cooperation for Assigned Names and Number) อ่านว่า ไอแคน เป็นองค์กรที่มีหน้าที่บริหารทรัพยากรโดเมนและจัดสรรค่าไอพี หน้าที่ส่วนหนึ่งของ ICANN ยังมอบอำนาจให้ศูนย์สารสนเทศเครือข่ายอินเทอร์เน็ตที่แบ่งออกไปตามภูมิภาพทำหน้าที่ดูแลการจัดสรรแอดเดรสและบริหารโดเมน ได้แก่

– ARIN (American Registry for Internet Numbers) ทำหน้าที่ให้บริการสำหรับกลุ่มประเทศในทวีปอเมริกาและแคนาดา

– RIPE (Reseaux IP Europeens Network Coordination Center) ทำหน้าที่ให้บริการสำหรับกลุ่มประเทศในทวีปยุโรป

– APNIC (Asia Pacific Network Information Center) ทำหน้าที่ดูแลแถบเอเชีย-แปซิฟิก ซึ่งผู้ให้บริการอินเทอร์เน็ตในประเทศไทยหรือ ISP (Internet Service Provider) นั้นไม่ว่าจะเป็น CATTelecom, TOT, True หรือ 3BB ก็ต้องถูกจัดสรรค่า IP Address และ Domain จาก APNIC เป็นอันดับแรกก่อน

– AfriNIC (African Network Information Center) ทำหน้าที่ให้บริการสำหรับกลุ่มประเทศทวีปแอฟริกา

– LACNIC (Latin America and Caribbean Network Information Center) จะทำหน้าที่ให้บริการสำหรับกลุ่มลาตินเมริกาและแถบทะเลแคริบเบียน

 

IP Address คืออะไร

เลขที่อยู่ไอพี (IP Address) คือหมายเลขที่ใช้ในระบบเครือข่ายที่ใช้โพรโทคอลอินเทอร์เน็ต (IP) คล้ายกับหมายเลขโทรศัพท์ แต่มีเลขจำนวน 32 บิต โดยการเขียนจะแบ่งเป็น 4 ชุด แต่ละชุดจะใช้เลขฐานสองจำนวน 8 บิต ซึ่งโดยทั่วไปแล้ว ผู้คนส่วนใหญ่จะคุ้นเคยกับระบบเลขฐานสิบ จึงมักแสดงผลโดยการใช้เลขฐานสิบจำนวน 4 ชุด ซึ่งแสดงถึงหมายเลขเฉพาะของเครื่องนั้นสำหรับการส่งข้อมูลภายในเครือข่าย โดยหมายเลยไอพีนี้มีไว้เพื่อให้ผู้ส่งรู้ว่าเครื่องของผู้รับคือใคร และผู้รับสามารถรู้ได้ว่าผู้ส่งคือใคร หมายเลขไอพีที่ใช้ในปัจจุบันมี 2 ประเภท ได้แก่

1. IP Version 4 (IPv4) เป็นเลข 32 บิต ระบุเลขไอพีได้ตั้งแต่ 0.0.0.0 ถึง 255.255.255.255 (บางตัวเป็นไอพีสงวนไว้สำหรับหน้าที่เฉพาะ เช่น 127.0.0.0 IPv4 นี้สามารถจำแนกได้เป็น 2 แบบ ได้แก่

– ไอพีส่วนตัว (Private IP) มีไว้สำหรับใช้งานภายในองค์กรเท่านั้น ไม่ว่าองค์กรนั้นจะมีขนาดใหญ๋หรือเล็กเพียงใดก็ตาม

– ไอพีสาธารณะ (Public IP) มีไว้สำหรับให้แต่ละองค์กรแต่ละบุคคลต่างก็สามารถเชื่อมต่อเข้าหากัน รับส่งข้อมูลระหว่างกันผ่านเครือข่ายสาธารณะได้

2. IP Version 6 (IPv6) ถูกสร้างขึ้นมาด้วยจุดประสงค์หลักในการแก้ปัญหาการขาดแคลนจำนวนหมายเลขไอพีใน IPv4 ซึ่งในมาตรฐานของ IPv6 นี้จะใช้ระบบเลข 128 บิต ในการระบุหมายเลขไอพี

 

โดเมนเนม (Domain Name)

หมายถึงชื่อที่ใช้ระบุลงในคอมพิวเตอร์เพื่อไปค้นหาในระบบ Domain Name System เพื่อระบุถึงไอพีแอดเดรสของชื่อนั่นๆ โดเมนเนมเป็นชื่อที่ตั้งขึ้นเพื่อให้ง่ายต่อการจดจำ เนื่องจากไอพีแอดเดรสนั้นจดจำได้ยากกว่าและเมื่อการเปลี่ยนแปลงไอพีแอดเดรส ผู้ใช้ไม่จำเป็นต้องรับรู้หรือจดจำไอพีแอดเดสรใหม่ สำหรับการจดทะเบียนชื่อโดเมน ในที่นี้ขอจำแนกเป็น 2 ประเภท คือ

1. การจดทะเบียนโดเมนต่างประเทศ

– .com ใช้ทำเว็บไซต์ของบริษัท ห้างร้าน รวมทั้งเว็บไซต์ส่วนตัว

– .net ใช้ทำเว็บไซต์เกี่ยวกับระบบเน็ตเวิร์คของคอมพิวเตอร์ หรือเว็บไซต์บริการอินเทอร์เน็ต

– .org ใช้ทำเว็บไซต์ของส่วนราชการ

2. การจดทะเบียนโดเมนภายในประเทศ

– .co.th ใช้ทำเว็บไซต์ของบริษัท ห้างร้านโดยทั่วไป

– .or.th ใช้ทำเว็บไซต์ส่วนราชการ องค์กร

– .ac.th ใช้ทำเว็บไซต์ของสถานศึกษาต่างๆ

– .go.th ใช้ทำเว็บไซต์ของส่วนราชการของประเทศไทย โดยปกติจะเป็นองค์กรขนาดใหญ่

– .in.th ใช้ทำเว็บไซต์ของบุคคลธรรมดาทั่วไป

 

หลักการตั้งชื่อโดเมน

1. ความยาวไม่เกิน 63 ตัวอักษร

2. สามารถใช้ตัวอักษรภาษาอังกฤษ ตัวเลข หรือเครื่องหมายขีด (-) ได้

3. ตัวอักษรภาษาอังกฤษใช้ตัวเล็กหรือตัวใหญ่ก็ได้

4. ห้ามใช้เครื่องหมายขีด (-) นำหน้าชื่อ domain

5. ห้ามเว้นวรรคในชื่อโดเมน

 

ระบบค้นหาข้อมูล (search engine) คือโปรแกรมที่ช่วยในการสืบค้นข้อมูล โดยเฉพาะข้อมูลอินเทอร์เน็ตโดยครอบคลุมทั้งข้อความ รูปภาพ ภาคเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่นๆ ซึ่งแตกต่างกันไป แล้วแต่โปรแกรมหรือผู้ให้บริหารแต่ละราย ระบบค้นหาข้อมูลส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่คิดว่าผู้ใช้น่าจะต้องขึ้นมาในปัจจุบัน ระบบค้นหาข้อมูลบางชนิด เช่น กูเกิล (Google) จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้นมาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อไป

 

เทคโนโลยีของระบบค้นหาข้อมูล (Search engine) ประกอบด้วย 3 ส่วนดังนี้

1. Keyword Index การค้นหาข้อมูลโดยการค้นจากข้อความในเว็บเพจที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูลอย่างน้อยๆ ประมาณ 200-300 ตัวอักษรแรกของเว็บเพจนั้น วิธีค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อน-หลัง และความถี่ในการนำเสนอข้อมูลนั้น การค้นหาข้อมูลโดยวิธีการนี้จะมีความรวดเร็วมาก แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร

2. Subject Directories การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา รายละเอียดของแต่ละเว็บเพจว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งนี้จะให้แรงงานคนในการพิจารณาเว็บเพจ ซึ่งทำให้การจัดหมวดหมู่ขึ้นอยู่กับวิจารญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ อยู่ในเครือข่ายข้อมูลอะไร

3. Metasearch Engines จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล แต่การค้นหาด้วยวิธีการนี้มีจุดด้อยคือวิธีการนี้จะไม่ให้ความสำคัญกับขนาดของตัวอักษรและมักจะไม่รองรับประเภท Natural Language (ภาษาพูด)

 

ชนิดของเว็บไซต์ค้นหาข้อมูลทางอินเทอร์เน็ต

1. กูเกิล (Google)                            2. ยาฮู (Yahoo)

3. เอ็มเอสเอ็น (MSN หรือ Bing)            4. เอโอแอล (AOL)

5. อาส์ก (Ask)                                6. ไป่ตู้ (Baidu) ระบบค้นหาข้อมูลของประเทศจีน

7. Cuil                                        8. ยานเดกซ์ (Yandex) ระบบค้นหาข้อมูลของรัสเซีย

 

คำอธิบายการค้นหาบางส่วนที่เป็นประโยชน์ต่อการค้นหาข้อมูล

1. การค้นหาข้อมูลในเว็บไซต์เป้าหมาย

วิธีค้นหาเฉพาะเจาะจงเว็บไซต์เป้าหมายโดยกำหนด site: ชื่อ URL เช่น ถ้าผู้ใช้ต้องการหาเว็บเกี่ยวกับการสอบ admission ของมหาวิทยาลัยธรรมศาสตร์ ให้พิมพ์ admission site:www.tu.ac.th

2. การค้นหา Link ต่างๆ ในเว็บไซต์เป้าหมาย

เมื่อเราต้องการค้นหาว่าในเว็บไซต์ที่เราสนใจนั้นมีความเกี่ยวข้องสัมพันธ์กับเว็บอื่นๆ หรือไม่ ก็สามารถทำได้โดยการค้นหาดังนี้ ให้พิมพ์ link: ชื่อ URL เช่น link:www.tu.ac.th

3. การค้นหาชนิดของนามสกุลของไฟล์

เราใช้คำค้นหาได้ดังนี้ filetype:ชื่อ นามสกุลไฟล์ เช่น หากต้องการค้นหา filetype ชนิดของ Microsoft Powerpoint 2007 ให้พิมพ์ filetype:pptx

4. การค้นหาอดีตที่เคยปรากฏของเว็บไซต์หรือข้อมูลบนเว็บไซต์เป้าหมาย ใน Google สามารเก็บ Cached ของเว็บที่จะเข้าชมไว้ได้ ประโยชน์ของ google cache คือช่วยให้เราสามารถเข้าเว็บไซต์ที่อาจโดนลบไปแล้ว โดยข้อมูลที่ได้จะเป็นข้อมูลก่อนถูกลบ

5. การค้นหา E-mail ของหน่วยงานหรือเว็บไซต์เป้าหมาย การค้นหาประเภทนี้จะทำให้เราได้รายชื่อของ E-mail หน่วยงานนั้นๆ ซึ่งอาจเป็นชื่อพนักงานคนหนึ่ง หรือชื่อกลุ่ม E-mail ของหน่วยงานหรือชื่อผู้ติดต่อเว็บไซต์นั้นๆ โดยใช้การค้นหาว่า @ ตามด้วยชื่อเว็บไซต์หน่วยงาน ยกตัวอย่างเช่น @mict.go.th

6. การค้นหาอื่นๆ ที่เป็นประโยชน์ การใช้เครื่องมือคำพูดได้ระหว่างคำที่เราต้องการค้นหาเฉพาะก็จะทำให้การค้นหานั้นเจาะจงมากขึ้น เช่น ค้นหาคำว่า “Social Media” ก็จะค้นหาเฉพาะคำที่เขียนแบบนี้โดยเฉพาะ

 

เทคนิคการค้นหาข้อมูลจาก Google ในเชิงลึก

1. ค้นหาดูเฉพาะ Title ของเว็บไซต์

เทคนิคการค้นหาดูเฉพาะ Title จะใช้คำว่า intitle: ตามด้วยชื่อข้อความที่ต้องการดู title วิธีนี้จะนิยมใช้กับการค้นหาข้อมูลเชิงลึกโดยเรียกว่า google hack

2. การค้นหา Password โดยใช้ google

เทคนิคการค้นหา Password นั้นจะใช้คำว่า filetype:lop inurl:”password.log” จะพบ password.log ที่เกิดขึ้นใน web server

 

การค้นหารายชื่อบุคคล

1. การค้นหาชื่อบุคคล สามารถทำได้โดยค้นหาจาก

– ใส่ชื่อหรือนามสกุล หรือทั้งชื่อและนามสกุล โดยใส่งเครื่องหมาย “” คลุมไว้ แล้วสืบค้นใน google, bing หรือ yahoo

– ค้นหาชื่อและประวัติการทำงานจากเว็บไซต์สมัครงานหรือเว็บ www.linkedin.com

– ค้นหารายชื่อในเว็บไซต์สมุดหน้าเหลือง www.yellowpages.co.th

          2. การค้นหาที่อยู่ ประกอบด้วย

– ที่อยู่ของบุคคลหากทราบเบอร์โทรศัพท์บ้านค้นหาได้ 2 วิธีคือจากเว็บไซต์สมุดหน้าเหลืองและเว็บไซต์ Phonebook ของ TOT phonebook.tot.co.th

– ที่อยู่ของ IP Address ซึ่งส่วนนี้ต้องเป็น Public IP Address สำหรับตรวจสอบ IP ของตนเองสามารถตรวจสอบได้ที่ www.whatismyipaddress.com

          3. การค้นหาประวัติข้อมูล การค้นหาประวัติข้อมูลย้อนหลัง สามารถทำได้ 2 วิธี ได้แก่

– ค้นหาจาก google caching

          – การค้นหาประวัติข้อมูลโดยการใช้ way back หรืออินเทอร์เน็ตอาร์ไคฟ์ (Internet Archive)

 

นักเรียนสามารถดาวน์โหลดเอกสารได้จากที่นี่ครับ ใบความรู้ที่ 2 การค้นหาข้อมูลจากอินเทอร์เน็ต

You may also like...

10 Responses

  1. ขอบคุณคุณครูค่ะ ที่ให้ความรู้เป้นวิทยาทาน เป้นครูเหมือนกัน แต่เอาความรู้นี้ไปสอนชาวบ้าน ค่ะ เป้นงานจิตอาสา ตอนนี้กำลังเปิดสอนอินเตอร์เน็ตฟรีค่ะ ทำบุญด้วยกันนะคะคุณครู.

  2. เรื่องยาวจัง แต่ได้ความร้มาก

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

This site uses Akismet to reduce spam. Learn how your comment data is processed.