1. صفحه اصلی
    • پربیننده‌ترین اخبار
    • مهمترین اخبار
    • آرشیو اخبار
  2. سیاسی
    • سیاست ایران
    • نظامی | دفاعی | امنیتی
    • گزارش و تحلیل سیاسی
    • مجلس و دولت
  3. امام و رهبری
  4. ورزشی
    • فوتبال ایران
    • فوتبال جهان
    • والیبال | بسکتبال | هندبال
    • کشتی و وزنه‌برداری
    • ورزش های رزمی
    • ورزش زنان
    • ورزش جهان
    • رشته های ورزشی
  5. بین الملل
    • دیپلماسی ایران
    • تولیدات دفاتر خارجی
    • آسیای غربی
    • افغانستان
    • آمریکا
    • اروپا
    • آسیا-اقیانوسیه
    • پاکستان و هند
    • ترکیه و اوراسیا
    • آفریقا
    • بیداری اسلامی
  6. فضا و نجوم
  7. اقتصادی
    • اقتصاد ایران
    • پول | ارز | بانک
    • خودرو
    • صنعت و تجارت
    • نفت و انرژی
    • فناوری اطلاعات | اینترنت | موبایل
    • کار آفرینی و اشتغال
    • راه و مسکن
    • هواشناسی
    • بازار سهام | بورس
    • کشاورزی
    • اقتصاد جهان
  8. اجتماعی
    • پزشکی
    • رسانه
    • طب سنتی
    • خانواده و جوانان
    • تهران
    • فرهنگیان و مدارس
    • پلیس
    • حقوقی و قضایی
    • علم و تکنولوژی
    • محیط زیست
    • سفر
    • حوادث
    • آسیب های اجتماعی
    • بازنشستگان
  9. فرهنگی
    • ادبیات و نشر
    • رادیو و تلویزیون
    • ‌دین ، قرآن و اندیشه
    • سینما و تئاتر
    • فرهنگ حماسه و مقاومت
    • موسیقی و تجسمی
  10. حوزه و روحانیت
  11. استانها
    • آذربایجان‌ شرقی
    • آذربایجان غربی
    • اردبیل
    • اصفهان
    • البرز
    • ایلام
    • بوشهر
    • استان تهران
    • چهارمحال و بختیاری
    • خراسان جنوبی
    • خراسان رضوی
    • خراسان شمالی
    • خوزستان
    • زنجان
    • سمنان
    • سیستان و بلوچستان
    • فارس
    • قزوین
    • قم
    • کاشان
    • کردستان
    • کرمان
    • کرمانشاه
    • کهگیلویه و بویراحمد
    • گلستان
    • گیلان
    • لرستان
    • مازندران
    • مرکزی
    • هرمزگان
    • همدان
    • یزد
    • جزایر خلیج فارس
  12. رسانه ها
    • چند رسانه ای
    • خواندنی
  13. بازار
    • قیمت خودرو
    • قیمت طلا، سکه و ارز
    • سازمان‌ها و شرکت‌ها
  14. عکس
  15. فیلم
  16. گرافیک و کاریکاتور
    • english
    • عربی
    • Türkçe
    • עברית
    • Pусский
  • RSS
  • تلگرام
  • اینستاگرام
  • توییتر
  •  
    آپارات
  •  
    سروش
  •  
    آی‌گپ
  •  
    گپ
  •  
    بله
  •  
    روبیکا
  •  
    ایتا
  • قیمت ارز و طلا
    لیگ ایران و جهان
  • صفحه اصلی
    • پربیننده‌ترین اخبار
    • مهمترین اخبار
    • آرشیو اخبار
  • سیاسی
    • سیاست ایران
    • نظامی | دفاعی | امنیتی
    • گزارش و تحلیل سیاسی
    • مجلس و دولت
  • امام و رهبری
  • ورزشی
    • فوتبال ایران
    • فوتبال جهان
    • والیبال | بسکتبال | هندبال
    • کشتی و وزنه‌برداری
    • ورزش های رزمی
    • ورزش زنان
    • ورزش جهان
    • رشته های ورزشی
  • بین الملل
    • دیپلماسی ایران
    • تولیدات دفاتر خارجی
    • آسیای غربی
    • افغانستان
    • آمریکا
    • اروپا
    • آسیا-اقیانوسیه
    • پاکستان و هند
    • ترکیه و اوراسیا
    • آفریقا
    • بیداری اسلامی
  • فضا و نجوم
  • اقتصادی
    • اقتصاد ایران
    • پول | ارز | بانک
    • خودرو
    • صنعت و تجارت
    • نفت و انرژی
    • فناوری اطلاعات | اینترنت | موبایل
    • کار آفرینی و اشتغال
    • راه و مسکن
    • هواشناسی
    • بازار سهام | بورس
    • کشاورزی
    • اقتصاد جهان
  • اجتماعی
    • پزشکی
    • رسانه
    • طب سنتی
    • خانواده و جوانان
    • تهران
    • فرهنگیان و مدارس
    • پلیس
    • حقوقی و قضایی
    • علم و تکنولوژی
    • محیط زیست
    • سفر
    • حوادث
    • آسیب های اجتماعی
    • بازنشستگان
  • فرهنگی
    • ادبیات و نشر
    • رادیو و تلویزیون
    • ‌دین ، قرآن و اندیشه
    • سینما و تئاتر
    • فرهنگ حماسه و مقاومت
    • موسیقی و تجسمی
  • حوزه و روحانیت
  • استانها
    • آذربایجان‌ شرقی
    • آذربایجان غربی
    • اردبیل
    • اصفهان
    • البرز
    • ایلام
    • بوشهر
    • استان تهران
    • چهارمحال و بختیاری
    • خراسان جنوبی
    • خراسان رضوی
    • خراسان شمالی
    • خوزستان
    • زنجان
    • سمنان
    • سیستان و بلوچستان
    • فارس
    • قزوین
    • قم
    • کاشان
    • کردستان
    • کرمان
    • کرمانشاه
    • کهگیلویه و بویراحمد
    • گلستان
    • گیلان
    • لرستان
    • مازندران
    • مرکزی
    • هرمزگان
    • همدان
    • یزد
    • جزایر خلیج فارس
  • رسانه ها
    • چند رسانه ای
    • خواندنی
  • بازار
    • قیمت خودرو
    • قیمت طلا، سکه و ارز
    • سازمان‌ها و شرکت‌ها
  • عکس
  • فیلم
  • گرافیک و کاریکاتور

برنده ایرانی جایزه مصطفی چگونه سرعت جستجوی داده را 40 برابر کرد؟

  • 31 شهريور 1404 - 19:03
  • اخبار اجتماعی
  • اخبار علم و تکنولوژی
برنده ایرانی جایزه مصطفی چگونه سرعت جستجوی داده را 40 برابر کرد؟

پروفسور وهاب میررکنی، برنده ایرانی جایزه مصطفی 2025، با طراحی الگوریتمی نوین مبتنی بر توزیع‌های p-پایدار و روش Locality-Sensitive Hashing، توانست فرآیند جست‌وجوی شباهت در کلان‌داده‌ها را تا 40 برابر سریع‌تر از روش‌های متداول انجام دهد.

اجتماعی

به گزارش خبرنگار اجتماعی خبرگزاری تسنیم، فهرست برگزیدگان جایزه مصطفی 2025 اعلام شد. بر اساس اطلاعات منتشرشده، امسال سه دانشمند برجسته از کشورهای مختلف به پاس نوآوری‌های ممتاز خود در حوزه‌های پیشرفته علم و فناوری این جایزه معتبر جهان اسلام را دریافت کردند. در میان این برگزیدگان، نام پروفسور وهاب میررکنی از ایران نیز به چشم می‌خورد که برای ارائه الگوریتمی نوآورانه بر پایه «توزیع‌های p-پایدار» و توسعه روش‌های کارآمد جست‌وجوی شباهت در داده‌های عظیم مورد تقدیر قرار گرفت

در جست‌وجوی شباهت  

تا به حال کتابی خوانده‌اید که تمام شدنش حس پایان یک دوستی را به همراه داشته باشد؟ کتابی که نه فقط محتوایش، بلکه حال‌وهوایش، نثرش و حتی چیزی ناپیدا میان سطرهایش با شما سخن گفته باشد. حالا تصور کنید به دنبال کتاب دیگری باشید که همان احساس را زنده کند. وارد کتابخانه‌ای بزرگ با قفسه‌هایی نامنظم می‌شوید؛ جایی که رمان، فلسفه، علم و تاریخ، همه در کنار هم و بی‌هیچ دسته‌بندی خاصی قرار گرفته‌اند. شروع به ورق‌زدن می‌کنید تا شاید حسی آشنا پیدا شود.  

با گذر زمان، خستگی توانتان را می‌گیرد. کتاب‌ها بسیارند و آنچه می‌خواهید به راحتی با چشم و دست پیدا نمی‌شود. در نهایت، پشت یکی از رایانه‌های کتابخانه می‌نشینید و توضیحی از کتاب محبوبتان را وارد می‌کنید. حالا این خواسته انسانی به مسئله‌ای ماشینی تبدیل می‌شود.  

در جهان کامپیوترها، چالش پیچیده‌تر است. موتور جست‌وجو باید از میان میلیاردها کتاب، اثری را بیابد که از نظر معنا یا ساختار مشابه باشد. مهم‌تر این‌که این فرآیند باید سریع و دقیق انجام شود، بی‌آنکه تک‌تک داده‌ها بررسی شوند. پاسخ در زبانی نه از جنس احساس، بلکه از جنس اعداد و فرمول‌هاست؛ جایی که الگوریتمی مبتنی بر توزیع‌های p-پایدار، همان‌گونه که پروفسور میررکنی و همکارانش طراحی کرده‌اند، به رایانه‌ها امکان می‌دهد بدون جست‌وجوی همه فضای دیجیتال، داده‌های مشابه را هوشمندانه و با سرعت بالا شناسایی کنند.

شباهت به زبان عددها  

شاید شباهت در نگاه اول ساده به نظر برسد، اما در دنیای داده‌ها، این مفهوم شکلی دقیق و متفاوت پیدا می‌کند: برای رایانه، همه‌چیز دنباله‌ای از اعداد است. یک عکس به شکل مجموعه‌ای از اعداد پیکسل‌ها و یک فایل صوتی، دنباله‌ای از اعداد مربوط به نوسانات فرکانسی است. در چنین فضایی، شباهت باید بر مبنای «فاصله» میان داده‌ها تعریف شود؛ هرچه این فاصله کمتر باشد، داده‌ها به هم شبیه‌ترند.  

برای اندازه‌گیری این فاصله، روش‌های متنوعی وجود دارد که یکی از مهم‌ترین آن‌ها LP-norm است. این روش با یک پارامتر به نام p، نوع نگاه ما به فاصله را تعیین می‌کند. اگر p=2 باشد، فاصله‌ اقلیدسی (کوتاه‌ترین مسیر مستقیم) به دست می‌آید؛ و اگر p=1 باشد، فاصله منهتنی (حرکت‌های عمودی و افقی) محاسبه می‌شود. مقدار p نوع تفاوتی را که الگوریتم بیشتر به آن توجه می‌کند مشخص می‌سازد.

خط‌کش دیجیتال  

در دنیای دیجیتال، داده‌ها به شکل «بردارهایی از اعداد» بازنمایی می‌شوند. موتور جست‌وجو برای تشخیص شباهت بین دو تصویر یا متن، فاصله میان بردارهای آن‌ها را می‌سنجد. انتخاب مقدار p بر اساس نیاز به دقت یا سرعت انجام می‌گیرد: p=1 برای توجه دقیق به اختلاف‌ها و p=2 برای دید کلی و سرعت بیشتر کاربرد دارد.  

در کاربردهای مرسوم، مقادیر p≥1 ترجیح داده می‌شوند، چون ویژگی‌های ریاضی همچون «قانون مثلث» را حفظ می‌کنند. با این حال، پژوهش‌های نوآورانه میررکنی نشان داده‌اند که حتی با p<1 نیز می‌توان جست‌وجویی سریع و کارآمد انجام داد، هرچند این حالت متریک دقیق محسوب نمی‌شود.

میان‌بُر در کلان‌داده‌ها  

حتی با بهترین روش‌های سنجش شباهت، مقایسه مستقیم همه داده‌ها بسیار زمان‌بر است. اینجاست که روش Locality-Sensitive Hashing (LSH) وارد عمل می‌شود. این تکنیک داده‌های مشابه را با استفاده از «توابع هش حساس به شباهت» به گروه‌های مشابه منتقل می‌کند.  

LSH بردارهای طولانی را به بردارهای خلاصه و کوتاهی تبدیل می‌کند که ویژگی‌های اصلی داده را حفظ می‌کنند؛ همانند چکیده‌ای که محتوای کتاب اصلی را منتقل می‌کند. برای حفظ تقریب فاصله، از «توزیع‌های p-پایدار» استفاده می‌شود. بسته به نوع فاصله (مانند اقلیدسی برای p=2)، توزیع مناسب انتخاب می‌گردد. این روش در آزمایش‌ها تا 40 برابر سریع‌تر از روش‌های سنتی مانند kd-tree عمل کرده و حتی در شرایط دشوار با p<1 کارایی خود را حفظ کرده است.  

نتیجه، میان‌بُری هوشمند در «شهر بی‌پایان داده‌ها» است؛ جایی که شناسایی شباهت دیگر نیازمند زمان‌های طولانی نیست و ماشین‌ها می‌توانند تفاوت‌ها و نزدیکی داده‌ها را با سرعت و دقتی بی‌سابقه تشخیص دهند.  

انتهای پیام/

 
R1378/P
قیمت ارز و طلا
لیگ ایران و جهان
حج و زیارت
tasnim
tasnim
tasnim
رازی
مادیران
شهر خبر
fownix
بیمه بازار
غار علیصدر
پاکسان
بانک صادرات
طبیعت
میهن
گوشتیران
triboon
تبلیغات
  • طراحی سایت
  • بازرگانی سیب
  • بهترین پزشک برای درمان انحراف ستون فقرات
  • سئو سایت
  • دکتر اورولوژی
  • آیا بیماری اسکولیوز خطرناک است؟
  • تور کیش اقساطی
  • درباره ما
  • ارتباط با ما
  • پربیننده‌ترین اخبار
  • پیوندها
  • بازار
  • قیمت ارز و طلا
  • لیگ ایران و جهان
  • آرشیو اخبار ؛ جدیدترین اخبار لحظه به لحظه امروز
ما را دنبال کنید:
  • RSS
  • تلگرام
  • اینستاگرام
  • توییتر
  • آپارات
  • سروش
  • آی‌گپ
  • گپ
  • بله
  • روبیکا
  • ایتا

All Content by Tasnim News Agency is licensed under a Creative Commons Attribution 4.0 International License.