LAB 1

จงทำการศึกษาค้นคว้า Types of Search Engines แต่ละประเภท พร้อมยกตัวอย่างประกอบของแต่ละประเภทให้ชัดเจน

♦ Crawler-Based Search Engines

https://i0.wp.com/www.typesofeverything.com/wp-content/uploads/2011/02/Search-Engines.gif

         Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ

1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก

2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหาและ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบ ของการทำสำเนาข้อมูลเหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com

Crawler Based Search Engine ได้แก่ Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog) ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และการจัดอันดับข้อมูลที่ต่างกัน

https://i0.wp.com/3.bp.blogspot.com/_59yXuaeOsxQ/TTQOL1sgUmI/AAAAAAAAALE/cIIGiXslG3A/s400/google.jpg

♦ Directories

https://i0.wp.com/4.bp.blogspot.com/_59yXuaeOsxQ/TTQOfcXpvRI/AAAAAAAAALI/-r0yOJ9sKvk/s400/4533776259_3337540e7b_o.jpg

        Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอ

ยกตัวอย่างดังนี้

ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory

1.ODP หรือ Dmoz ที่หลายๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engineหลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ (URL : http://www.dmoz.org )

2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )

3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ

♦ Hybrid Search Engines

        Hybrid Search Engines เสิร์ชเอนจิ้นลูกผสม ทุกวันนี้มีพัฒนาการของ เสิร์ชเอนจิ้น ในลักษณะที่นำข้อดีของทั้ง crawler-based และ directories มาใช้งานมากขึ้น แต่โดยปกติแล้วเสิร์ชเอนจิ้นลูกผสม นั้น มักจะให้ผลลัพธ์ในการค้นหาเอียงไปทางใดทางหนึ่งมากกว่าอีกทางหนึ่ง เช่น MSN search นั้น มักจะโอนเอียงไปทางไดเรกทอรี่ที่ดูแลโดย editor มากกว่า crawler-based อาทิเช่น LookSmart (เสิร์ชเอนจิ้นตัวหนึ่งของ MSN) แต่ก็มีการโอนเอียงไปทาง crawler-basedเช่นกัน อาทิเช่น Inktormi (เสิร์ชเอนจิ้นตัวหนึ่งของ MSN)โดยเฉพาะอย่างยิ่งคำค้นหาที่มีความสลับซับซ้อนมากๆ

https://i0.wp.com/blogs.murdoch.edu.au/genevievetan/files/2010/09/hybrd.jpg

♦ Meta Search Engines

Parallel Search Engines, Mega Search Engines, Multi-Threaded Search Engines  มีมากมายหลายชื่อเช่นเดียวกับ Search Engines ทั่ว ๆ ไป เช่น Dogpile, Inference Find เป็นต้น ถือเป็นจุดเริ่มต้นที่ดีที่สุดหากสามารถใช้เครื่องมือประเภทนี้ค้นก่อนเป็นอันดับแรกช่วยประหยัดเวลาในการค้น เนื่องจากเครื่องมือชนิดนี้ทำหน้าที่เป็นตัวกลางที่ช่วยส่งคำถามต่อไปยัง Search Engines ชื่อต่าง ๆ ที่เป็นที่นิยมซึ่งรวบรวมไว้และส่งคำตอบกลับมาให้ แตกต่างจากการสืบค้นจากเครื่องมือช่วยค้นแต่ละชื่อหมายถึงค้นได้ทีละฐานข้อมูลซึ่งต้องใช้เวลามากและผลที่ได้ก็แตกต่างกันด้วย

Meta Search Engines ไม่มีฐานข้อมูล Web Page เป็นของตนเอง แต่เป็นการพัฒนาโปรแกรมคอมพิวเตอร์ให้มีกลไกช่วยค้นใน Search Engines หรือ Web Page หลายชื่อในเวลาเดียวกัน (Search multiple databases simultaneously via a single interface) ฉะนั้นผลของการสืบค้นจะเป็นกลุ่มของข้อมูลที่มาจากหลากหลาย Search Engines ถือได้ว่าหากใช้ Meta Search Engines จะเป็นทางลัด (Shortcut) ช่วยให้เข้าถึงที่หมายเร็วขึ้น

คุณลักษณะ (Features) ที่สำคัญของ Meta Search Engines แต่ละชื่อซึ่งมีลักษณะคล้ายกัน คือ มีความเร็วในการสืบค้นเพราะการส่งคำถามไปแต่ละ Search Engines ให้ทำการค้นหาพร้อมกันในเวลาเดียวกัน และมีโปรเซสเซอร์ความเร็วสูงช่วยส่งผลข้อมูลกลับมาหน้าจอโดยรวดเร็วอีกทั้งใช้หลาย ๆ Search Engines ที่เป็นทีนิยมเป็นฐานข้อมูลในการค้น

ส่วนคุณลักษณะที่แตกต่างของ Meta Search Engines ชื่อต่าง ๆ คือ การจัดเรียงผลของการสืบค้นจะแตกต่างกันไป ความสามารถในการลบทิ้งของข้อมูลที่ซ้ำกัน ความสามารถในการสืบค้นแบบซับซ้อน เช่น การค้นด้วยกลุ่มคำ วลี การค้นด้วย Boolean logic (and, or, not) การใช้ truncation เป็นต้น

https://i0.wp.com/2.bp.blogspot.com/_59yXuaeOsxQ/TTQSi-eDV_I/AAAAAAAAALk/zulEL8k1nhE/s640/Search-Engine-Marketing.jpg

♦ Specialty Search Engines

          Specialty Search Engine คือเสิร์ชเอนจิ้นที่ใช้เสิร์ชข้อมูลเฉพาะด้าน เฉพาะบางประเภท ไม่ใช่เสิร์ชข้อมูลทั้งหมดที่เจอในเว็บไซต์ทั่วโลกเหมือนกับเสิร์ชเอนจิ้น 2 ประเภทแรก เช่น เสิร์ชเฉพาะข้อมูลบล็อก, เสิร์ชเฉพาะไฟล์ภาพ, เสิร์ชเฉพาะคลิปวิดีโอ, เสิร์ชเฉพาะข่าว, เสิร์ชเฉพาะแผนที่, เสิร์ชเฉพาะสินค้า หรือเสิร์ชเฉพาะไฟล์ Torrent เท่านั้น ตัวอย่างของเสิร์ชเอนจิ้นประเภทนี้ก็เช่น Technorati (เสิร์ชบล็อก), Google Image (เสิร์ชภาพ), Google Video (เสิร์ชวิดีโอ), Google News (เสิร์ชข่าว), Google Maps (เสิร์ชแผ่นที่) เป็นต้น

https://i0.wp.com/www.webreference.com/programming/search2/fig1-12a.jpg

https://i0.wp.com/www.webreference.com/programming/search2/fig1-12b.jpg

ขอบคุณข้อมูลจาก

http://blog.seo.co.th/ประเภทของ-search-engine
http://nampo.blogspot.com/2011/01/search-engine.html
http://www.pongsak.com/boonphakdee/search_engine/search_tool.htm
http://www.intrendbook.com/index.php/article/11-seo-04
http://akira2010.blogspot.com/2008/01/search-engine.html

Sign Our Guestbook