گفتگوی اختصاصی خراسان با مخترع پیشرفته‌ترین سیستم «تشخیص صدا در رایانه‌های هوشمند»

پروفسور پرهام اعرابی دانشمند جوان ایرانی‌تبار مقیم کانادا که به عنوان یکی از 35 مخترع جوان زیر 35 سال از سوی مجله تکنولوژی ریویو وابسته به موسسه فناوری ماساچوست (MIT) انتخاب شد 6 مهرماه جایزه خود را از این موسسه دریافت کرد.

اعرابی دانشمند جوان ایرانی با 29 سال سن یکی از جوان‌ترین پروفسورهای دانشگاه‌های کانادا است، وی در سال 1355در تهران به دنیا آمد و تحصیلات خود را تا 12 سالگی در ایران ادامه داد.
وی پس از مهاجرت به کانادا در سال 1367 تحصیلات خود را در تورنتو ادامه داده و مدارج لیسانس و فوق‌لیسانس خود را در رشته مهندسی برق به ترتیب در سال‌های 1998 و 1999 دریافت کرد. پروفسور اعرابی تحصیلات دکترای مهندسی برق را نیز در مدت 2 سال در دانشگاه استنفورد به پایان برد و از همان سال 2001 یعنی در 24 سالگی به عنوان یکی از جوان‌ترین اساتید دانشگاه‌‌های کانادا به کادر علمی دانشگاه تورنتو ملحق شده و از جولای امسال یعنی دو ماه پیش به درجه پروفسوری رسیده است.
پروفسور اعرابی علاوه بر جایزه فوق‌الذکر به واسطه فعالیت‌های تحقیقاتی و موقعیت‌های آموزشی تاکنون جوایز داخلی و بین‌المللی متعدد دیگری را نیز در کانادا دریافت کرده است که ازجمله آنها جایزه «محقق کانادایی»‌در سال 2002 و جایزه بین‌المللی آموزش مهندسی برق (ویژه اساتید جوان) در سال 2004 است.
خبرنگار گروه دانش و فناوری خراسان در یک گفتگوی اینترنتی با پرهام اعرابی علت اعطای بعضی جوایز و به ویژه اعطای عنوان اخیر از سوی موسسه فناوری ماساچوست به وی را جویا شد که ترجمه آن در ذیل می‌آید.
علت انتخاب شما به عنوان 35 مخترع جوان زیر 35 سال از سوی مجله تکنولوژی ریویو وابسته به موسسه فناوری ماساچوست MIT چه بود؟
وی گفت: به دو دلیل انتخاب شدم: اول: تحقیقات در زمینه تقویت توان رایانه‌های هوشمند در تشخیص صدای انسان از میان انبوهی از صداهای زائد و مزاحم محیطی و دوم بهبود امکان جستجو و طبقه‌بندی تصاویر در شبکه اینترنت
شما به خاطر پژوهش‌هایتان بر روی تشخیص صدای انسان توسط رایانه‌ها اگر اشتباه نکنم در اکتبر 2004 موفق شدید جایزه اول آموزش بین‌المللی رااز سوی موسسه بین‌المللی جامعه مهندسین الکترونیک کسب کنید. لطفا راجع به این رشته از تحقیقاتتان توضیح دهید.گویا شما در این زمینه از توانایی گوش انسان در ؟ و تشخیص صداها الهام گرفته‌اید آیا درست است؟
ج- جایزه‌ای که از آن نام بردید برای اولین بار در سطح بین‌المللی اهدا شد و دلیل اهدای آن ابداع شیوه نوینی از بهره‌گیری از سیستم‌های شناخت مصنوعی صدا و تلفیق آن با تکنولوژی کامپیوتری بود. به طوری که انسان برای تایپ و یا هر استفاده‌ای احتیاجی به کیبورد نداشته باشد و کاربر با کامپیوتر صحبت کند به این منظور و برای اینکه کامپیوتر بتواند درک درستی از صحبت‌های کاربر داشته باشد از چندین میکروفون و دوربین استفاده می‌کنیم. این دوربین‌ها به کامپیوتر کمک می‌کند که حرف یک انسان را بهتر درک کند از طرف دیگر وقتی فقط یک میکروفون برای ضبط صدا باشد ممکن است در آن نویز وجود داشته باشد و یا امکان دارد چند نفر با هم صحبت کنند و کامپیوتر گمراه شود و نفهمد که کاربر اصلی چه گفته است وقتی چندین دوربین و میکروفون کار گذاشته می‌شود کامپیوتر می‌تواند حرکات لب کاربر را دنبال و حرف‌های بقیه را از کاربر اصلی جدا کند و صداهایی را که نویز هستند و از چپ یا راست می‌آیند را قطع کند و فقط به کاربر اصلی گوش دهد و با توجه به حرکت لب و شکل آوا و صدا و حرفی که از آن خارج می‌شود را تشخیص داده و بفهمد که چه لغتی از دهان کاربر بیرون آمده است. این کارها با کمک دانشجویان نم صورت گرفته است. حسگرهای مضاعف چند تایی مثل دو یا چند میکروفون همانند گوش انسان برای تشخیص صداهای مختلف یا یک نوع صدا از بیان چندین صدایی که از محیط شنیده می‌شود عمل می‌کند. در گوش انسان هزاران حسگر وجود دارد که هرکدام مثل یک میکروفون قوی عمل می‌کنند. کامپیوترها هم با چندین میکروفون می‌توانند با استفاده از هوش مصنوعی منبع صوتی اصلی را که از کاربر به آنها می‌رسد تشخیص دهند.
اکنون راجع به تحقیقات اخیرتان بر روی جستجوی تصویر در اینترنت توضیح دهید که گفته می‌شود تحولی در این زمینه در شبکه ایجاد می‌کند. اصلا فرق این سیستم با موتور جستجوی عکس در گوگل یا یاهو چیست؟
در حال حاضر جستجوی عکس در اینترنت براساس اسمی صورت می‌گیرد که در زیر آن نوشته شده که متاسفانه شامل چند درصد (یعنی فقط 5 درصد) عکس‌ها بر روی شبکه می‌شود در حالی که بسیاری از تصاویری که بدون اسم( حدود 95%) بر روی اینترنت گذاشته شده‌اند موتورهای جستجو قادر به یافتن آنها نیستند. طراحی سیستمی که برروی آن کار می‌کنیم به گونه‌ای است که با بهره‌گیری از هوش مصنوعی و درک و فهم تصویر در مواقعی که کاربر اسم دقیق عکسی را که به دنبال آن می‌گردد نمی‌داند به کمک او می‌آید. در این سیستم موارد مختلفی از مشخصه‌های هر تصویر مانند رنگ، شکل، اندازه و نوع درک می‌شود و با توجه به آنها تصویر موردنظر کاربر جستجو و یافت می‌شود.البته این نوع جستجو هم می‌تواند دارای خطاهایی باشد که به هرحال قابل اغماض است. گوگل، یاهو و یا هر موتور جستجوی دیگر، عکس موردنظر را مبتنی بر تکس(متن) جستجو می‌کند اما این سیستم با استفاده از تکنیک‌های پیشرفته هوش مصنوعی از توانمندی بالایی در تشخیص تصاویر برخوردار است.
این موتور جدید جستجوی عکس کی وارد بازار می‌شود؟
ما در حال کار بر روی این سیستم هستیم که آن را هرچه سریعتر وارد بازار کنیم. من فکر می‌کنم تا سال آینده این کار به پایان برسد و تا نوامبر 2006 سایتی مستقل برای جستجوی عکس روی شبکه راه‌اندازی کنیم. البته من باید بگویم که یکی از دانشجویانم در حال کار بر روی تلفیق سیستم طراحی شده از سوی ما، یعنی جستجوی عکس براساس درک تصویر و سیستم قبلی یعنی جستجوی آن براساس متن و اسم تصویر است تا بتوان از قابلیت‌های هر دو سیستم برای جستجو استفاده کرد تا به این ترتیب بیشترین و دقیق‌ترین منابع تصویری موجود در این شبکه اطلاعاتی جهانی در اختیار جستجوگران قرار گیرد.
آیا از نظر تامین هزینه‌های تحقیقات با مشکلی برخورد نکردید و دولت یا شرکت‌هایی شما را حمایت می‌کنند؟
دولت کانادا بخش زیادی از هزینه‌ها را متقبل شده و از سوی شرکت‌های خصوصی کامپیوتری مثل Dell وAltera و غیره نیز حمایت شده‌ام و اصلا پروژه سیستم جستجوی تصویر مبتنی بر درک تصویر از سال 2004 با حمایت تعدادی از شرکت‌های اینترنتی آغاز شد.
شما گفته‌اید از این سیستم ابداعی علاوه بر کامپیوترها در هدایت خودروها و موبایل‌ها هم می‌توان استفاده کرد آیا در حال حاضر چنین چیزی امکان‌پذیر است؟
سیستم هوش مصنوعی که درحال حاضر در بعضی از خودروها استفاده می‌شود چون نمی‌تواند صدای اصلی را از نویزهای محیطی تشخیص دهد باید در محیط‌های ساکت مورد استفاده قرار گیرد اما در طرح ما که با موفقیت به پایان رسیده این مشکل نیز تا حدی حل شده است. البته استفاده از این سیستم‌های صوتی برای کنترل خودروها در حال حاضر به دلیل هزینه زیاد و امکان خطایی که در آن هست معقول به نظر نمی‌رسد و عملی نیست ولی می‌توان از آن جهت فرمان‌های غیرحساس مثل روشن کردن رادیو و یا فرمان‌هایی از این قبیل استفاده کرد.
نظرتان راجع به جوانان و دانشجویان ایرانی چیست؟ آیا حاضرید یافته‌هایتان را در اختیار آنها بگذارید؟
در ایران دانشجویانی وجود دارند که انسان را متحیر می‌کنند دانشجویانی که از هوش، استعداد، پتانسیل و ظرفیت بسیار بالایی برخوردارند و اگر زمینه تحقیقات و پژوهش برای آنها فراهم شود مطمئن هستم این جوانان می‌توانند کارهای بزرگی انجام دهند.
من هم با کمال میل حاضرم با آنها و مراکز تحقیقاتی ایران در ارتباط باشم و تبادل اطلاعات
کنم پروفسور پرهام اعرابی: ابداع روشی برای جستجوی عکس دراینترنت با استفاده از هوش مصنوعی ازجمله دلایل اعطای جایزه به من بوده است.
تا نوامبر 2006 سایت مستقلی برای جستجوی عکس روی شبکه اینترنت راه‌اندازی می‌شود
سیستم تقویت توان رایانه‌های هوشمند در تشخیص صدای انسان در هدایت خودروها و موبایل‌ها هم کاربرد دارد

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اجرا شده توسط: همیار وردپرس