บทความ - 00150 : เสิร์ชเอนจิ้น...การค้นไอเดียบนเว็บที่ยังไม่ดีพอ

» EE43» กระทู้» รวมรูป» เนื้อหา บทความ» บทบรรณาธิการ» รายชื่อ» Mail ee43» หลวงตามหาบัว» วัดบุญญาวาส

เสิร์ชเอนจิ้น...การค้นไอเดียบนเว็บที่ยังไม่ดีพอ

เครื่องกลที่ค้นหาความหมายมากกว่าถ้อยคำจะทำให้เว็บมีค่าและมีความหมายในการจัดการได้ดียิ่งขึ้นมากถึงมากที่สุด เป็นอนาคตของแนวทางการพัฒนาเทคนิคการค้นหาข้อมูล และการเพิ่มความสามารถซอฟต์แวร์ตัวแทนให้เป็นมากกว่าหุ่นยนต์ธรรมดาๆ ในที่สุด

"หากว่ายังคงจำกันได้ถึงเรื่องราวของ Software Agent หรือซอฟต์แวร์ตัวแทนที่เป็นซอฟต์แวร์โรบ็อทตัวเล็กๆ ที่เป็นตัวแทนของความเป็นตัวเราบนโลกแห่งอินเทอร์เน็ต และทำสิ่งต่างๆ ให้ข้อมูลต่างๆ ได้มากกว่าจักรกลอื่นๆ จะสามารถทำได้ เจ้าตัวแทนเหล่านี้จะรู้ซึ้งถึงทุกอย่างที่เราต้องการ, ที่เราชอบหรือที่เราสนใจ และมันจะใช้เวลาตลอดทั้งคืนในการค้นหาข่าวและข้อมูลข่าวสาร จองเที่ยวบินไปติดต่อธุรกิจให้กับเรา แม้แต่หาข้อมูลในการวิจัยขั้นต้นให้กับการทำรายงานเสนอฝ่ายบริหารให้กับเราได้" อ๊ะ อ๊ะ ช้าก่อนแม้ว่าจะดูลื่นไหลน่าใช้งาน และสวยงามแต่มันไม่เคยเกิดขึ้น! เจ้าโรบ็อทดังกล่าวนั้นยากยิ่งที่จะสร้างขึ้นได้จริงอย่างไรก็ตามเว็บเพจถูกออกแบบมาให้ทำงานตอบรับกับการบริโภคของมนุษย์ แม้ว่าถ้อยคำต่างๆ จะมีความหมายหรือมีมากกว่าความหมายเพียงหนึ่งเดียวด้วยซ้ำไปสำหรับเอกสารที่อยู่แตกต่างสถานที่กัน สัญลักษณ์หรือเครื่องหมายที่เราใช้เป็นตัวหาความหมายที่ถูกต้องนั้นคือ ตำแหน่งที่อยู่บนหน้าเว็บเพจ, ส่วนประกอบแวดล้อม, รูปภาพและส่วนประกอบที่ไม่ใช้ตัวอักษรอื่นๆ การวิเคราะห์สิ่งต่างๆ เหล่านี้นั้นอยู่นอกเหนือความสามารถที่เจ้าโรบ็อทจะสามารถคิดได้ และข้อมูลที่มีประโยชน์ที่สุดมากมายบนเว็บถูกเก็บอยู่ในฐานข้อมูลที่พวกมันไม่สามารถเข้าถึงได้เลย

ทุกวันนี้นั้นคณะกรรมการทีมค้นคว้าวิจัยทั่วโลกต่างก็โจมตีปัญหาจากมุมมองที่ต่างออกไป พวกเขาต้องการสร้างให้เว็บมีความเป็นอันหนึ่งอันเดียวกันมากยิ่งขึ้น, มีข้อมูลที่สามารถสืบค้นบนมาตรฐานเดียวกันได้มากขึ้นและเอื้อต่อการเข้าใจของคอมพิวเตอร์มากขึ้น ซึ่งหากเป็นเช่นนั้นเจ้าซอฟต์แวร์ตัวแทนก็ไม่จำเป็นที่จะต้องฉลาดมากนัก หรือในอีกคำพูดหนึ่งก็คือหากว่าเว็บเพจมีระบบภาษาของตนเอง หากเรามีภาษาที่เข้าใจของเว็บจริงๆ สิ่งที่เป็นที่ต้องการของซ็อฟแวร์ตัวแทนก็ไม่จำเป็นต้องเข้าใจความหมายซ่อนเร้นมากมายหลากหลายอย่างที่เราเป็นห่วงกันเลย ขณะเดียวกันช่วงเวลานี้ก็เป็นเวลาที่เว็บเองกำลังมีการเติบโตพัฒนา หลังสิ้นสุดทศวรรษที่ 1990s ผู้นำแห่งเสิร์ชเอนจิ้นอย่าง Altavista สามารถทำดัชนีข้อมูลได้เพียง 30 เปอร์เซ็นต์ ของข้อมูลที่อยู่บนเว็บเพจทั้งหมดเท่านั้น การค้นหาต่างๆ จึงมักจะพลาดจากเอกสารสำคัญๆ รวมถึงอันดับความสำคัญของเอกสารที่จัดให้โดยอัตโนมัติก็ใช้การไม่ค่อยได้เท่าไรนัก ในช่วงเวลาดังกล่าว Google ที่มีระบบจัดการดัชนีชี้บ่งที่ดีกว่าก็เริ่มเข้ามา รวมถึงอันดับที่เชื่อถือได้มากกว่าอีกด้วย ในขณะที่ Google สามารถเข้ากันได้กับการเติบโตพัฒนาของเว็บ แต่มันสามารถเข้าได้กับความต้องการของบันดาลูกค้าผู้ใช้บริการเซิร์ฟเว็บได้หรือยัง? อันนี้ยังคงยากที่จะตอบได้อยู่ บางคนที่ถามคำถามหรือพยายามค้นหาเอกสารที่เกี่ยวกับการแตกหักของกระดูกหัวเข่า อาจจะอยากทราบถึงศัลยแพทย์ที่เก่งที่สุดในบริเวณย่านที่พักอาศัย รวมถึงรายชื่อ


ต่อย [ 2004-05-06 04:17:13 ]
» EE43» กระทู้» รวมรูป» เนื้อหา บทความ» บทบรรณาธิการ» รายชื่อ» Mail ee43» หลวงตามหาบัว» วัดบุญญาวาส
Hosted by : Pawee, Developed by Zarawut EE 43