1. صفحه اصلی
    • پربیننده‌ترین اخبار
    • مهمترین اخبار
    • آرشیو اخبار
  2. سیاسی
    • سیاست ایران
    • نظامی | دفاعی | امنیتی
    • گزارش و تحلیل سیاسی
    • مجلس و دولت
  3. امام و رهبری
  4. ورزشی
    • فوتبال ایران
    • فوتبال جهان
    • والیبال | بسکتبال | هندبال
    • کشتی و وزنه‌برداری
    • ورزش های رزمی
    • ورزش زنان
    • ورزش جهان
    • رشته های ورزشی
  5. بین الملل
    • دیپلماسی ایران
    • تولیدات دفاتر خارجی
    • آسیای غربی
    • افغانستان
    • آمریکا
    • اروپا
    • آسیا-اقیانوسیه
    • پاکستان و هند
    • ترکیه و اوراسیا
    • آفریقا
    • بیداری اسلامی
  6. فضا و نجوم
  7. اقتصادی
    • اقتصاد ایران
    • پول | ارز | بانک
    • خودرو
    • صنعت و تجارت
    • نفت و انرژی
    • فناوری اطلاعات | اینترنت | موبایل
    • کار آفرینی و اشتغال
    • راه و مسکن
    • هواشناسی
    • بازار سهام | بورس
    • کشاورزی
    • اقتصاد جهان
  8. اجتماعی
    • پزشکی
    • رسانه
    • طب سنتی
    • خانواده و جوانان
    • تهران
    • فرهنگیان و مدارس
    • پلیس
    • حقوقی و قضایی
    • علم و تکنولوژی
    • محیط زیست
    • سفر
    • حوادث
    • آسیب های اجتماعی
    • بازنشستگان
  9. فرهنگی
    • ادبیات و نشر
    • رادیو و تلویزیون
    • ‌دین ، قرآن و اندیشه
    • سینما و تئاتر
    • فرهنگ حماسه و مقاومت
    • موسیقی و تجسمی
  10. حوزه و روحانیت
  11. استانها
    • آذربایجان‌ شرقی
    • آذربایجان غربی
    • اردبیل
    • اصفهان
    • البرز
    • ایلام
    • بوشهر
    • استان تهران
    • چهارمحال و بختیاری
    • خراسان جنوبی
    • خراسان رضوی
    • خراسان شمالی
    • خوزستان
    • زنجان
    • سمنان
    • سیستان و بلوچستان
    • فارس
    • قزوین
    • قم
    • کاشان
    • کردستان
    • کرمان
    • کرمانشاه
    • کهگیلویه و بویراحمد
    • گلستان
    • گیلان
    • لرستان
    • مازندران
    • مرکزی
    • هرمزگان
    • همدان
    • یزد
    • جزایر خلیج فارس
  12. رسانه ها
    • چند رسانه ای
    • خواندنی
  13. بازار
    • قیمت خودرو
    • قیمت طلا، سکه و ارز
    • سازمان‌ها و شرکت‌ها
  14. عکس
  15. فیلم
  16. گرافیک و کاریکاتور
    • english
    • عربی
    • Türkçe
    • עברית
    • Pусский
  • RSS
  • تلگرام
  • اینستاگرام
  • توییتر
  •  
    آپارات
  •  
    سروش
  •  
    آی‌گپ
  •  
    گپ
  •  
    بله
  •  
    روبیکا
  •  
    ایتا
  • قیمت ارز و طلا
    لیگ ایران و جهان
  • صفحه اصلی
    • پربیننده‌ترین اخبار
    • مهمترین اخبار
    • آرشیو اخبار
  • سیاسی
    • سیاست ایران
    • نظامی | دفاعی | امنیتی
    • گزارش و تحلیل سیاسی
    • مجلس و دولت
  • امام و رهبری
  • ورزشی
    • فوتبال ایران
    • فوتبال جهان
    • والیبال | بسکتبال | هندبال
    • کشتی و وزنه‌برداری
    • ورزش های رزمی
    • ورزش زنان
    • ورزش جهان
    • رشته های ورزشی
  • بین الملل
    • دیپلماسی ایران
    • تولیدات دفاتر خارجی
    • آسیای غربی
    • افغانستان
    • آمریکا
    • اروپا
    • آسیا-اقیانوسیه
    • پاکستان و هند
    • ترکیه و اوراسیا
    • آفریقا
    • بیداری اسلامی
  • فضا و نجوم
  • اقتصادی
    • اقتصاد ایران
    • پول | ارز | بانک
    • خودرو
    • صنعت و تجارت
    • نفت و انرژی
    • فناوری اطلاعات | اینترنت | موبایل
    • کار آفرینی و اشتغال
    • راه و مسکن
    • هواشناسی
    • بازار سهام | بورس
    • کشاورزی
    • اقتصاد جهان
  • اجتماعی
    • پزشکی
    • رسانه
    • طب سنتی
    • خانواده و جوانان
    • تهران
    • فرهنگیان و مدارس
    • پلیس
    • حقوقی و قضایی
    • علم و تکنولوژی
    • محیط زیست
    • سفر
    • حوادث
    • آسیب های اجتماعی
    • بازنشستگان
  • فرهنگی
    • ادبیات و نشر
    • رادیو و تلویزیون
    • ‌دین ، قرآن و اندیشه
    • سینما و تئاتر
    • فرهنگ حماسه و مقاومت
    • موسیقی و تجسمی
  • حوزه و روحانیت
  • استانها
    • آذربایجان‌ شرقی
    • آذربایجان غربی
    • اردبیل
    • اصفهان
    • البرز
    • ایلام
    • بوشهر
    • استان تهران
    • چهارمحال و بختیاری
    • خراسان جنوبی
    • خراسان رضوی
    • خراسان شمالی
    • خوزستان
    • زنجان
    • سمنان
    • سیستان و بلوچستان
    • فارس
    • قزوین
    • قم
    • کاشان
    • کردستان
    • کرمان
    • کرمانشاه
    • کهگیلویه و بویراحمد
    • گلستان
    • گیلان
    • لرستان
    • مازندران
    • مرکزی
    • هرمزگان
    • همدان
    • یزد
    • جزایر خلیج فارس
  • رسانه ها
    • چند رسانه ای
    • خواندنی
  • بازار
    • قیمت خودرو
    • قیمت طلا، سکه و ارز
    • سازمان‌ها و شرکت‌ها
  • عکس
  • فیلم
  • گرافیک و کاریکاتور

جویشگر بومی به شناسایی میلیون‌ها واژه فارسی دست یافت

  • 06 مهر 1394 - 04:41
  • اخبار اقتصادی
جویشگر بومی به شناسایی میلیون‌ها واژه فارسی دست یافت

مدیر یکی از پروژه‌های موتور جستجوگر بومی از شناسایی 100 میلیون واژه منحصر به فرد فارسی توسط این جستجوگر خبر داد.

اقتصادی

به گزارش خبرنگار فناوری اطلاعات و ارتباطات خبرگزاری تسنیم، علی محمد زارع بیدکی با بیان اینکه برنامه‌نویسان و محققان نخبه کشورمان در بخش تحقیق و توسعه پردازش زبان موفق به چنین دستاوردی شدند، اظهار کرد: ظرفیت و توانایی این جستجوگر بومی برای پردازش زبانی به یکصد میلیون کلمه یکتا (اعم از درست یا نادرست) در صفحات فارسی ارتقا یافته که البته این فرآیند همچنان در حال توسعه است.

وی با اشاره به اینکه کمتر از 10 درصد این کلمات دارای ارزش اطلاعاتی و پردازشی هستند گفت: از مجموع یکصد میلیون واژه شناسایی شده حدود 10 میلیون کلمه از لحاظ املائی و مفهومی صحیح است که البته پردازشگر زبان پارسی‌جو می‌تواند حتی عبارت‌های نادرست را شناسایی و آن را به شکل صحیح جستجو کند.

او به یکی دیگر از قابلیت‌های ویژه این موتور جستجوگر ایرانی پرداخت و ادامه داد: بخش پردازش زبان پارسی‌جو توانایی استخراج دوازده هزار جفت کلمه مترادف از محتوای وب را دارد که قابلیت مذکور این امکان را به کاربر خواهد داد تا کلمات، واژه‌ها و حتی عبارات هم معنی فارسی را به طور یکجا جستجو کند.

این مدیر پروژه تشخیص افعال صرفی در این حوزه را یکی دیگر از ویژگی‌های بی‌بدیل این جستجوگر ایرانی برشمرد و اضافه کرد: این موتور جستجوگر قادر است بیش از 9 هزار شکل صرفی از افعال را تشخیص و آنها را به یکدیگر تبدیل کند، امکانی که باعث می‌شود کاربران فارسی زبان نه تنها یک عبارت و جمله بلکه اشکال مختلف صرفی (انشایی) یک جمله را به طور همزمان جستجو کنند.

وی خاطر نشان کرد: ماشینی کردن فرآیند درک و برداشت مفاهیم از یک زبان طبیعی بزرگترین چالش در جستجوگرهای بومی محسوب می‌شود که البته دانشمندان و نخبگان کشورمان در حوزه فناوری اطلاعات موفق شدند این مانع بزرگ را در این موتور جستجوگر به قابلیتی خاص مبدل سازد، به طوریکه هم‌اکنون زبان فارسی در این موتور جستجوگر به طور کامل ماشینی شده و می‌تواند مفاهیم عبارات کاربر را درک و پس از پردازش آن را جستجو کند.

زارع بیدکی بزرگترین دلیل موفقیت موتورهای بومی را موضوع زبان دانست و افزود: با نگاهی دقیق به موتورهای جستجو در دنیا به این نکته پی می‌بریم که مرز ایجاد موتورهای جستجو و استفاده کاربران از آنها جغرافیایی نبوده است بلکه زبان یک عامل تعیین کننده در استفاده از این ابزار نوین است به گونه‌ای که موتور جستجوی "یاندکس" روسیه علت موفقیت خود را فهم و پردازش بهتر زبان روسی می‌داند، به طوریکه کاربران روسی زبان کشورهای اوکراین، قزاقستان، آذربایجان و بلاروس را نیز جذب کرده و از  این طریق درآمدزایی هنگفتی می‌کند.

وی در ادامه ابراز کرد: با قدرت گرفتن موتورهای بومی در ایران، این فرصت وجود دارد تا این جستجوگرها در کشورهای فارسی زبان نیز مورد استفاده قرار گیرد و به این واسطه از منافع اقتصادی بازار بزرگ و بِکر موتور جستجو در این کشورها بهره‌مند شد.

مدیر پروژه موتور جستجوگر پارسی جو در پایان تاکید کرد: به طور کلی قابلیت ویژه موتورهای بومی شناخت صحیح زبان مادری یک کشور و بهره‌مندی از ابزارهای پردازش زبان بومی و دسترسی به زبان شناسان آن کشور است که البته همین امر باعث خواهد شد تا موتورهای جستجوگر داخلی بتوانند به نیازهای ایرانیان خارج از کشور مانند دریافت اطلاعات و اخبار روزانه یا خدمات‌رسانی در مراودات متنوع پاسخ دهند.

انتهای پیام/

 
R1012190/P1010113
قیمت ارز و طلا
لیگ ایران و جهان
بیشتر بخوانید
زوایای پنهان جویشگرهای بومی
tasnim
tasnim
tasnim
رازی
رسپینا
مادیران
شهر خبر
fownix
بیمه بازار
غار علیصدر
پاکسان
بانک صادرات
طبیعت
میهن
گوشتیران
triboon
تبلیغات
  • طراحی سایت
  • بازرگانی سیب
  • بهترین پزشک برای درمان انحراف ستون فقرات
  • سئو سایت
  • دکتر اورولوژی
  • آیا بیماری اسکولیوز خطرناک است؟
  • تور کیش اقساطی
  • درباره ما
  • ارتباط با ما
  • پربیننده‌ترین اخبار
  • پیوندها
  • بازار
  • قیمت ارز و طلا
  • لیگ ایران و جهان
  • آرشیو اخبار ؛ جدیدترین اخبار لحظه به لحظه امروز
ما را دنبال کنید:
  • RSS
  • تلگرام
  • اینستاگرام
  • توییتر
  • آپارات
  • سروش
  • آی‌گپ
  • گپ
  • بله
  • روبیکا
  • ایتا

All Content by Tasnim News Agency is licensed under a Creative Commons Attribution 4.0 International License.