کد مطلب: 17028
 
تاریخ انتشار : دوشنبه ۵ آبان ۱۳۹۳ ساعت ۱۲:۱۴
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی از راه‌اندازی آزمایشی نخستین موتور جست‌و‌جوی تصویری ایرانی با نام «کاوش» خبر داد.
آزمایش نخستین موتور جست‌و‌جوی تصویری در ایران
 
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی از راه‌اندازی آزمایشی نخستین موتور جست‌و‌جوی تصویری ایرانی با نام «کاوش» خبر داد.
 
علی احمدی که درباره این حرکت علمی با «ایران» گفت وگو می کرد، افزود: جست‌و‌جو در این موتور، هم بر اساس کلید واژه و هم بر اساس تصویر و هم ترکیبی از این دو صورت می‌گیرد که در داخل کشور بی‌نظیر بوده و در صورت توسعه، قابلیت رقابت با موتورهای جست‌و‌جوی بین‌المللی را دارد.

«کاوش» یک نام ایرانی
 
سال‌هاست که به موازات راه‌اندازی موتور‌های جست‌و‌جوی خارجی در اینترنت، مهندسان ایرانی هم به فکر راه‌اندازی نمونه‌های داخلی آن بوده‌اند که بر همین اساس موتورهای جست‌و‌جوی ایرانی نظیر «پارسی جو» و «جس جو» ثمره نخستین اقدام‌ها برای راه‌اندازی موتور جست‌و‌جوی بومی است که اگر چه همه آنها امکاناتی نظیر جست‌و‌جوی وب را به کاربر ارائه می‌دهند اما قابلیت لازم برای جست‌و‌جوی تصاویر مشابه در آنها وجود ندارد.
 
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در گفت‌وگو با ایران با بیان اینکه جست‌و‌جو در «کاوش»، هم بر اساس کلید واژه و هم بر اساس تصویر و هم ترکیبی از این دو صورت می‌گیرد درباره دلایل راه‌اندازی آن در کشور گفت: در ابتدای سال 1391 پیشنهاد راه‌اندازی موتور جست‌و‌جو که مبتنی بر محتوای تصویر باشد را در قالب یک طرح پژوهشی به سازمان فناوری اطلاعات زیر مجموعه وزارت ارتباطات و فناوری اطلاعات ارائه کردیم و آنها با توجه به اینکه این موتور جست‌و‌جو می‌توانست در طرح‌ شبکه ملی اطلاعات مورد استفاده قرار گیرد، استقبال کردند و بر این اساس، اجرای پروژه طراحی و راه‌اندازی موتور جست‌و‌جوی کاوش از تیرماه همان سال آغاز شد. وی افزود: حدود یک سال و سه ماه بعد، راه‌اندازی آزمایشی موتور جست‌و‌جوی «کاوش» روی دامنه فارسی (ir.) و برای حدود یک میلیون صفحه وب فارسی، در مراسمی ویژه و با حضور مسئولان وقت سازمان فناوری اطلاعات صورت گرفت و از آن زمان تاکنون عملیات توسعه سیستم با امکانات دانشگاه ادامه دارد.
 
احمدی درباره علت نام‌گذاری این موتور جست‌و‌جوی ایرانی به نام «کاوش» خاطر نشان کرد: معنای «کاوش» جست‌وجو کردن است که یک اسم کاملاً ایرانی بوده و تا به امروز هم از آن استفاده نشده است.
 
مدیر پروژه جست‌و‌جوگر بومی «کاوش» در ادامه به ویژگی‌های اصلی این موتور جست‌و‌جو اشاره کرد و گفت: ویژگی اصلی این موتور جست‌و‌جو که هم در آن مقطع زمانی جدید بود و هم در حال حاضر جزو نیازهای جدی کاربران وب است، این است که ما بتوانیم روی محتوای تصاویر، جست‌و‌جو کنیم. در فضای پویایی مانند وب که دائم در حال تغییر و افزایش است، جست‌و‌جوی تصویر کار دشواری است و با جست‌و‌جو در یک پایگاه تصویری ایستا که یک تعداد مشخصی داده در آن وجود دارد متفاوت است و کار وقتی سخت‌تر می‌شود که جست‌و‌جوی تصاویر بر اساس محتوا یا مشابهت‌های تصویری و نه فقط شاخص‌های متنی که برای هر تصویر موجود است و اصطلاحاً به آن برچسب‌های روی تصویر گفته می‌شود، صورت گیرد.
 
وی ادامه داد: در طول اجرای پروژه ترکیبی از سه تیم نرم افزار، پردازش متن و پردازش تصویر روی پروژه کار کرده‌اند و در نتیجه توانستیم بر اساس حوزه‌های تعریف شده، در زمان مقرر کار را به سرانجام برسانیم.
 
احمدی خاطر نشان کرد: راه‌اندازی اولیه موتور جست‌وجوی «کاوش» بر مبنای پوشش یک میلیون صفحه وب فارسی انجام شد و برای توسعه سیستم به منظور پوشش صفحات بیشتر نیاز به تجهیزات سخت افزاری و منابع مالی است که سازمان فناوری اطلاعات به عنوان کارفرمای پروژه تلاش‌هایی را در جهت جذب منابع از بخش دولتی و خصوصی  به عمل آورد که با تغییر دولت، این موضوع دچار وقفه شد.

کاوش در رقابت با نمونه‌های خارجی
 
«ما تا ماه‌های اخیر سعی کردیم با سرورها و امکانات سخت افزاری دانشگاه، موتور جست‌و‌جو را در فضای وب بالا نگه‌داریم ولی برای اینکه کاربر هنگام مراجعه بتواند جست‌و‌جوی کاملی را انجام بدهد لازم است که پوشش لازم روی تمامی صفحات وب (هم فارسی و هم غیر فارسی) صورت بگیرد تا کاربر احساس ناکارآمدی و بی‌دقتی نسبت به نتایج جست‌و‌جو نداشته باشد و این مستلزم منابع سخت افزاری فراتری است و بر همین اساس ترجیح دادیم که موتور جست‌و‌جوی «کاوش» را موقتاً به شبکه داخلی دانشگاه منتقل کنیم تا کار روی پروژه ادامه پیدا کند.»
 
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در ادامه گفت‌وگو با ایران با بیان مطلب فوق و با ذکر اینکه با حمایت مالی در قالب سرمایه گذاری، توانایی این را داریم که موتور جست‌و‌جو را از محیط آزمایشی وارد محیط واقعی وب و کاربران واقعی بکنیم گفت: هدف اصلی ما، تمرکز و توجه بیشتر روی ویژگی‌های صفحات وب فارسی و همچنین موضوعات مورد علاقه کاربران فارسی زبان در جست‌و‌جوهایشان برای بالا بردن دقت و سرعت جست‌و‌جوست.
احمدی با تأکید بر اینکه در صورت تأمین تجهیزات سخت افزاری و امکانات مالی، موتور جست‌و‌جوی «کاوش» می‌تواند با موتورهای جست‌و‌جوی بزرگ رقابت کند تصریح کرد: در الگوریتم‌های جست‌و‌جوی موتور جست‌و‌جوگر «کاوش» امتیازاتی نظیر شناسایی زبان شناسانه ویژگی‌های زبان فارسی، سرعت بیشتر در جست‌و‌جوی عبارات، حضور سرورها در داخل کشور و در نتیجه سرعت بالای تبادل اطلاعات وجود دارد که کاربر فارسی زبان به مرور ترجیح خواهد داد از آن استفاده کند.
وی افزود: اگر چه گوگل مدتی است که جست‌و‌جوی تصویری‌اش را رونمایی کرده است اما اگر این سرویس را تست کرده باشید متوجه خواهید شد که دقت مورد انتظار را ندارد و این حوزه‌، هنوز فضای کار زیادی دارد.

تلاش یک ساله برای راه‌اندازی «کاوش»
 
«موتور جست‌و‌جوی «کاوش» حاصل تلاش بیش از یک سال تیمی متشکل از 20 نفر از استادان و اعضای هیأت علمی دانشگاه خواجه نصیرالدین طوسی و دانشجویان مقاطع دکترا، کارشناسی ارشد و کارشناسی گرایش‌های نرم افزار و هوش مصنوعی از این دانشگاه و سایر دانشگاه‌های کشور است. از چالش‌های اصلی این پروژه کار کردن با داده‌های حجم بالا (Big Data)، مقیاس پذیر کردن پروژه، استفاده از پایگاه داده‌های غیر رابطه‌ای (No SQL) و استفاده از الگوریتم‌های پردازش موازی بوده است.
 
رئیس دانشکده مهندسی کامپیوتر دانشگاه خواجه نصیرالدین طوسی در بخش دیگری از گفت‌وگو با ایران با بیان مطلب فوق و با اشاره به ویژگی دیگر موتور جست‌و‌جوی «کاوش» گفت: در موتور جست‌و‌جوی «کاوش» این امکان وجود دارد که کاربر یک تصویر دلخواه را بارگذاری کرده و موتور بر اساس جست‌و‌جو در نمایه‌های تصویری، تمام تصاویر مشابه آن را برایش استخراج و نمایش دهد. امکان دوم هم که معمولاً بیشتر کاربرد دارد، آن است که کاربر به عنوان مثال کلید واژه «دانشگاه خواجه نصیرالدین طوسی» را وارد می‌کند و بر همین اساس، موتور جست‌و‌جو تمام تصاویر مرتبط با آن را در تمامی صفحاتی که تصاویر دانشگاه خواجه نصیرالدین طوسی قرار دارد، شناسایی و نمایش می‌دهد تا کاربر بتواند جست‌و‌جویش را با انتخاب یکی از این تصاویر و جست‌و‌جوی دقیقتر برای تصاویر مشابه آن، تکمیل کند.
 
احمدی در ادامه با طرح گلایه از متولیان فناوری اطلاعات کشور به خاطر حمایت نکردن جدی از پروژه‌ای با این درجه از اهمیت اظهار داشت: این موتور جست‌و‌جو، جزو کارهای ماندگار برای کشور است که در حال حاضر جای آن در فضای وب فارسی بشدت خالی است و گام‌های اصلی برای راه‌اندازی آن تاکنون برداشته شده است و تنها یک اراده ملی لازم است تا کار به نتیجه نهایی برسد. بیش از اینکه بحث بودجه مطرح باشد، خواستن و اراده‌ جدی برای عملیاتی کردن این موتور جست‌و‌جوی ملی مطرح است. می‌توان گفت این خواست، در حال حاضر در میان متولیان فناوری اطلاعات کشور وجود دارد ولی اراده جدی و قاطع برای اینکه کار جنبه ملی بیابد، هنوز شکل نگرفته است.
 
مدیر پروژه جست‌و‌جوگر بومی «کاوش» در پایان با تأکید بر اینکه در صورت حمایت متولیان فناوری اطلاعات و سرمایه‌گذاری بخش خصوصی، در یک بازه زمانی 8 ماهه این موتور جست‌و‌جوی ملی عملیاتی شده و وارد فضای وب کشور خواهد شد تصریح کرد: ما نباید به یک موتور جست‌و‌جو بسنده کنیم و موتورهای دیگر هم باید کارشان را شروع کنند تا از میان آنها یک یا دو موتور که کارآمدتر هستند، مورد اقبال عموم قرار گیرند. من آرزو می‌کنم قبل از اینکه خیلی دیر شود، موتور جست‌و‌جوی «کاوش» عملیاتی شود و زحمتی که دوستان کشیده‌اند بی‌ثمر نماند.
 
اگر چه تاکنون چندین موتور جست‌و‌جوی متنی در فضای وب فارسی کار خود را آغاز کرده و برخی هم محکوم به شکست شده‌اند اما به نظر می‌رسد با راه‌اندازی شبکه ملی اطلاعات تا سال آینده، ضرورت راه‌اندازی موتورهای جست‌و‌جوی ملی در حوزه متن و تصویر همچنان بیشتر از گذشته احساس می‌شود.