Iranian Agriculture News Agency

سیستم‌های تشخیص چهره چطور از فیلم‌های هالیوودی به دنیای واقعی رسیدند

الگوریتم‌های تشخیص چهره ممکن است به زودی راه خود را به دوربین سوپرمارکت محل شما هم باز کنند. بخوانید تا با کاربردهای هوش مصنوعی در این حوزه آشنا شوید.

سلام و علیک دوربین‌ها با ما




به گزارش کوارتز، تصویر ما سالیان درازی است در مکان‌های عمومی مختلف ثبت می‌شود: پشت فرمان اتومبیل، هنگام عبور از در چرخان هتل، موقع مراجعه به اداره‌ها و شرکت‌ها، در پست‌هایی که دیگران در شبکه‌های اجتماعی می‌گذارند و غیره و غیره. اما حتی اگر دوربین‌ها درست روی صورت ما متمرکز شده باشند باز هم انگار امید داریم که غریبه‌ها ما را در تصاویر تشخیص ندهند و چیزی از این بابت ما را تحت تاثیر قرار ندهد. تصور عمومی ما این است که پیدا کردن یک فرد خاص در ماه‌ها و ساعت‌ها فیلم ضبط‌شده توسط دوربین‌های امنیتی یا گشتن در تصاویر موجود در کل شبکه‌های اجتماعی آن‌قدر سخت است که کسی دنبالش را نمی‌گیرد. اما واقعیت این است که چنین کاری برای ربات‌ها اصلا سخت نیست.

ابزارهای دقیق تشخیص چهره و هویت، سالیان دراز در تریلرهای هالیوودی به کار گرفته می‌شده و شمار نامحدودی عکس و ویدئو انگار در کسری از ثانیه مورد جست‌وجو قرار می‌گرفته و نتیجه فورا به دست می‌آمده است. بخش زیادی از آنچه در این فیلم‌ها می‌بینید واقعی نیست اما ممکن است به زودی واقعی شود.

شرکت‌هایی مثل فیس‌بوک و بایدو (غول چینی جست‌وجوی اینترنتی) مدت زیادی است که روی تکنولوژی پیشرفته تشخیص چهره به کمک هوش مصنوعی کار می‌کنند؛ یعنی چیزی مشابه همان تکنولوژی موجود در تریلرهای هالیوودی. میزان خطا در این سیستم‌ها حالا به تدریج در حال کاهش است و در عین حال، آنها دارند بیشتر و بیشتر در دسترس قرار می‌گیرند. اینکه در آینده نزدیک، هر ویدئویی به راحتی برای تشخیص افراد، اشیا و کارهای انجام‌شده مورد استفاده قرار بگیرد اصلا دور از ذهن نیست.

پژوهشگران در حوزه هوش مصنوعی سال‌ها در تلاش بوده‌اند تا الگوریتم‌هایی بسازند که بتواند تصویر را ببیند و مشخص کند که دقیقا چه چیزی در آن تصویر موجود است. اما پیچیدگی تصاویر و اینکه هریک از آنها میلیون‌ها پیکسل را در خود جا داده‌اند تا الگوهای خاصی را بسازند، تا مدت زیادی جلوی موفقیت الگوریتم‌ها را در این خصوص گرفته بود.

اما در سال ۲۰۱۲ میلادی پژوهشگران تکنیکی به نام «یادگیری عمیق» را به کار گرفتند که زیرشاخه‌ای از یادگیری ماشینی بر مبنای مجموعه‌ای از الگوریتم‌هاست. چنین سیستمی بر این اساس بنا شده: مغز ما نورون‌ها (یاخته‌های عصبی)ی متصل به همی دارد که می‌توانند کارکرد ریاضی داشته باشند و اگر آنها با حجم زیادی از تصویر مواجه شوند حتی بهتر هم کار می‌کنند. اگر نمونه‌های زیادی را در اختیار یک شبکه عصبی عمیق بگذارید، این شبکه می‌تواند الگوهای مشترکی را بین تصاویر پیدا کند.

از آن زمان تاکنون، چنین سیستم‌هایی از لحاظ پیچیدگی و ابعاد به شدت رشد کرده‌اند. پژوهشگران شروع به ساخت شبکه‌های بزرگ‌تری از نورون‌ها کردند و هم‌زمان سازندگان سخت‌افزارهایی مثل انویدیا پردازشگرهای خاصی را ساختند که این شبکه‌ها را به شکل تصاعدی سریع‌تر می‌کند. نتیجه‌اش این بوده که چنین سیستم‌هایی خیلی بهتر از گذشته می‌توانند کار کنند. اگر حجم بزرگی از تصاویر یا ویدئوها را در اختیار این سیستم‌ها بگذارید، می‌توانید به آنها آموزش بدهید که چهره افراد را هم تشخیص بدهند و بارها و بارها آن را شناسایی کنند.

عظیم‌ترین مثال استفاده از این سیستم‌ها را می‌توان در مگافیس- پروژه دانشگاه واشینگتن- مشاهده کرد. این پروژه شامل نزدیک به 5 میلیون تصویر از ۶۷۲ هزار نفر می‌شد که از فلیکر جمع‌آوری شده بود. وقتی سیستم برای یافتن دو تصویر از یک فرد خاص از میان یک میلیون تصویر مورد آزمایش قرار گرفت، نتیجه این بود: اگر فقط یک شانس برای حدس‌زدن وجود داشته باشد، تا ۷۵ درصد احتمال درست‌بودن آن حدس وجود دارد. اگر شانس بیشتری (10 بار) برای حدس‌زدن وجود داشته باشد، تا ۹۰ درصد احتمال درست‌بودن آن وجود دارد.

ایرا کملماخر استاد دانشگاه واشینگتن و مسئول این پروژه می‌گوید: «ما نیاز داریم که تشخیص چهره را در ابعاد خیلی زیادی آزمایش کنیم تا کاربردهای عملی آن بیشتر شود و موفقیت یا ضعف الگوریتم‌های تشخیصی آشکار شود.»

ویدئو که از تکنیک‌های مشابهی برای بی‌حرکت‌کردن تصاویر استفاده می‌کند اما به قدرت پردازش بالاتری نیاز دارد نیز به هوش مصنوعی اجازه می‌دهد تا آنچه را که دارد در طول زمان رخ می‌دهد درک کند. بایدو در همین ماه آگوست گذشته اعلام کرد که در چالش اکتیویتی‌نت پیروز شده و توانسته با 87.6 درصد موفقیت، کارهایی را که انسان‌ها در 300 هزار ویدئو انجام می‌دهند تشخیص دهد و برچسب درست آن کار را روی ویدئو بزند. در آن ویدئوها انسان‌ها در حال انجام کارهایی مثل چوب‌بری، تمیز کردن پنجره، راه‌بردن سگ و فعالیت‌های مشابه دیده می‌شدند.

فیس‌بوک هم از غول‌هایی است که به تکنولوژی‌های این حوزه توجه زیادی نشان داده است تا بتواند تشخیص دهد که چه‌کسی در هر ویدئوی لایو استریم (پخش زنده) در فیس‌بوک حضور دارد و چه‌کاری را در آن انجام می‌دهد. سال گذشته یواکین کوینیونرو کاندلا رئیس بخش یادگیری کاربردی ماشینی گفت که حالت ایده‌آل برای فیس‌بوک این است که بداند در هر ویدئوی لایو استریم دارد چه اتفاقی می‌افتد. این باعث می‌شود که فیس‌بوک قادر به هدایت کانال‌های ویدئویی برای سلایق مختلف کاربران باشد و در عین حال برخی محتواها را کنترل کند.

تشخیص چهره در تصاویر بی‌حرکت و نیز در ویدئو حالا دارد به وضوح وارد دنیای حقیقی هم می‌شود و کاربردهای زیادی پیدا می‌کند. مثلا بایدو دارد برنامه‌ای را آغاز می‌کند که در آن تشخیص چهره به جای کنترل بلیت به هنگام ورود به کنسرت‌ها و مراسم‌ مختلف مورد استفاده قرار می‌گیرد. مکان برگزاری مراسم از قبل مجهز به اطلاعات درباره مهمان‌ها شده است و بنابراین سیستم می‌داند که شما چه‌کسی هستید. احتمالا این کار با استفاده از تصویری که شما در سایت آنها آپلود کرده‌اید یا از طریق پروفایل‌های شما در شبکه‌های اجتماعی انجام می‌شود. به هر حال، وقتی وارد محل برگزاری مراسم می‌شوید سیستم می‌تواند تشخیص دهد که آیا اجازه ورود دارید یا نه.

امسال روش مشابهی در پاریس و در فرودگاه شارل دوگل به مدت سه ماه مورد آزمایش قرار گرفت. همچنین سال گذشته برنامه‌ای مشابه در ژاپن پیاده شد اما نتایج هیچ‌یک از این برنامه‌ها به صورت عمومی مشخص نشده است.

در امریکا نیز این تکنولوژی کم‌کم و به شیوه‌های مختلف - ولی فعلا محدود- مورد استفاده قرار گرفته است. در چند هفته اخیر پلیس راهنمایی و رانندگی نیویورک اعلام کرد که با استفاده از تکنولوژی تشخیص چهره توانسته 4 هزار متخلف را بازداشت کند. در این روش، نرم‌افزاری مورد استفاده قرار می‌گیرد که تصاویر افراد متقاضی گواهی‌نامه جدید رانندگی را با تصاویری که پیش‌تر در سیستم موجود بوده، مقایسه می‌کند. در چنین شرایطی، کار برای افراد جاعل که به دنبال سرقت هویت و استفاده از هویت دزدی برای گرفتن مدارک جدید مثل گواهی‌نامه هستند سخت می‌شود. از آنجایی که مشکل سرقت هویت در امریکا بسیار شدید است، پیشرفت‌های جدید می‌تواند کمک بزرگی به پلیس باشد. البته اگر اطلاعات نه‌تنها به صورت محلی و شهری، بلکه در سطح ایالتی یا فدرال در امریکا فراهم شود، تشخیص‌های بسیار دقیق‌تری نیز به دست می‌آید. هوش مصنوعی هرچه اطلاعات وسیع‌تری در اختیار داشته باشد بهتر عمل می‌کند.

با این اوصاف به نظر می‌رسد که پیشرفت بیشتر در این حوزه هم چندان دور از دسترس نیست. اکسون -شرکتی که قبلا به عنوان تِیزر شناخته می‌شد و بزرگ‌ترین توزیع‌کننده دوربین‌های بدنی پلیس در امریکا است- اخیرا تلاش‌های زیادی را صورت داده تا هوش مصنوعی را با محصولات خود ترکیب کند و در این راستا، امسال دو شرکت در حوزه تکنولوژی هوش مصنوعی را خریداری کرده است.

ریک اسمیت مدیرعامل اکسون پیش‌تر در این خصوص گفته بود که مورد استفاده ایده‌آل از هوش مصنوعی می‌تواند این باشد که پلیس در موارد مختلفی با کار از پشت میز بتواند مجرمان را در حوزه‌های مختلف با استفاده از تصاویر و تشخیص چهره، تعقیب کند. به گفته او، چنین سیستم گسترده‌ای حتما در آینده مورد استفاده خواهد بود.

شرکت دیگری که در این حوزه فعال بوده، موتورولا است. موتورولا نیز دوربین‌های بدنی می‌سازد و نرم‌افزار خود را با تکیه بر قابلیت آن برای شناخت سریع چهره‌ها ساخته است. چنین دوربینی مثلا می‌تواند به هنگام جست‌وجو برای کودکان دزدیده‌شده مورد استفاده قرار بگیرد.

اما واضح‌ترین نمودی که در خصوص سیستم‌های تشخیص چهره وجود دارد، برای مردم عادی همان دوربین‌هایی است که در مکان‌های عمومی کار گذاشته شده‌اند. این دوربین‌ها هم با استفاده از هوش مصنوعی وارد مراحل جدیدی خواهند شد. اینتل در همین ماه آوریل سال جاری اعلام کرد که سخت‌افزاری برای دوربین‌های امنیتی ساخته که قابلیت بررسی تراکم جمعیت، تشخیص چهره، شمارش افراد و برجسته‌نمایی تصویر را دارد و بر این اساس می‌تواند تحلیل شخصیت نیز انجام بدهد.

یک دوربین دیگر به نام دی‌ان‌ان‌کم هم ساخته شده که در همان حوزه یادگیری عمیق فعال است. این دوربین ضدآب و خودکفا است و این‌طور گفته شده که همیشه و در هر حالی می‌تواند کارش را درست انجام دهد. یعنی مثلا می‌توان این دوربین را در محیطی دورافتاده و کاملا عاری از امکانات برای برقراری اتصال اینترنتی قرار داد یا حتی آن را پشت صندوق در فروشگاه‌ها نصب کرد تا مشتریان همیشگی را بشناسد و خدمات لازم را به آنها ارائه بدهد.

در این میان، مسئله‌ای که کمتر از همه مورد توجه قرار دارد این است که شهروندان قانون‌مداری که نمی‌خواهند چهره‌شان در دوربین‌ها ثبت شود و بعدا از آن در سیستم‌های تشخیص هویت استفاده شود چه باید بکنند؟ می‌توان گفت که کار خاصی از دست آنها برنمی‌آید. برخی پژوهش‌ها نشان داده که راه‌هایی برای گول‌زدن هوش مصنوعی و سیستم تشخیص چهره نیز وجود دارد؛ مثل طراحی عینک‌های خاص یا به‌کارگیری رنگ‌های خاصی روی چهره. چنین کارهایی ممکن است بتواند الگوریتم‌ها را گول بزند و جلوی تشخیص چهره را بگیرد. اما همین کارها هم نیاز به شناخت عمیقی از نحوه کار الگوریتم‌های تشخیص چهره دارد و کار هرکسی نیست. شاید اگرهر کسی کلاهی روی سرش بگذارد تازه بتواند کمی کار این الگوریتم‌ها را دشوار کند.

ترجمه: فرحناز سالمی- آینده نگر

انتهای پیام

دیدگاه تان را بنویسید