سیستمهای تشخیص چهره چطور از فیلمهای هالیوودی به دنیای واقعی رسیدند
سلام و علیک دوربینها با ما
الگوریتمهای تشخیص چهره ممکن است به زودی راه خود را به دوربین سوپرمارکت محل شما هم باز کنند. بخوانید تا با کاربردهای هوش مصنوعی در این حوزه آشنا شوید.
به گزارش کوارتز، تصویر ما سالیان درازی است در مکانهای عمومی مختلف ثبت میشود: پشت فرمان اتومبیل، هنگام عبور از در چرخان هتل، موقع مراجعه به ادارهها و شرکتها، در پستهایی که دیگران در شبکههای اجتماعی میگذارند و غیره و غیره. اما حتی اگر دوربینها درست روی صورت ما متمرکز شده باشند باز هم انگار امید داریم که غریبهها ما را در تصاویر تشخیص ندهند و چیزی از این بابت ما را تحت تاثیر قرار ندهد. تصور عمومی ما این است که پیدا کردن یک فرد خاص در ماهها و ساعتها فیلم ضبطشده توسط دوربینهای امنیتی یا گشتن در تصاویر موجود در کل شبکههای اجتماعی آنقدر سخت است که کسی دنبالش را نمیگیرد. اما واقعیت این است که چنین کاری برای رباتها اصلا سخت نیست.
ابزارهای دقیق تشخیص چهره و هویت، سالیان دراز در تریلرهای هالیوودی به کار گرفته میشده و شمار نامحدودی عکس و ویدئو انگار در کسری از ثانیه مورد جستوجو قرار میگرفته و نتیجه فورا به دست میآمده است. بخش زیادی از آنچه در این فیلمها میبینید واقعی نیست اما ممکن است به زودی واقعی شود.
شرکتهایی مثل فیسبوک و بایدو (غول چینی جستوجوی اینترنتی) مدت زیادی است که روی تکنولوژی پیشرفته تشخیص چهره به کمک هوش مصنوعی کار میکنند؛ یعنی چیزی مشابه همان تکنولوژی موجود در تریلرهای هالیوودی. میزان خطا در این سیستمها حالا به تدریج در حال کاهش است و در عین حال، آنها دارند بیشتر و بیشتر در دسترس قرار میگیرند. اینکه در آینده نزدیک، هر ویدئویی به راحتی برای تشخیص افراد، اشیا و کارهای انجامشده مورد استفاده قرار بگیرد اصلا دور از ذهن نیست.
پژوهشگران در حوزه هوش مصنوعی سالها در تلاش بودهاند تا الگوریتمهایی بسازند که بتواند تصویر را ببیند و مشخص کند که دقیقا چه چیزی در آن تصویر موجود است. اما پیچیدگی تصاویر و اینکه هریک از آنها میلیونها پیکسل را در خود جا دادهاند تا الگوهای خاصی را بسازند، تا مدت زیادی جلوی موفقیت الگوریتمها را در این خصوص گرفته بود.
اما در سال ۲۰۱۲ میلادی پژوهشگران تکنیکی به نام «یادگیری عمیق» را به کار گرفتند که زیرشاخهای از یادگیری ماشینی بر مبنای مجموعهای از الگوریتمهاست. چنین سیستمی بر این اساس بنا شده: مغز ما نورونها (یاختههای عصبی)ی متصل به همی دارد که میتوانند کارکرد ریاضی داشته باشند و اگر آنها با حجم زیادی از تصویر مواجه شوند حتی بهتر هم کار میکنند. اگر نمونههای زیادی را در اختیار یک شبکه عصبی عمیق بگذارید، این شبکه میتواند الگوهای مشترکی را بین تصاویر پیدا کند.
از آن زمان تاکنون، چنین سیستمهایی از لحاظ پیچیدگی و ابعاد به شدت رشد کردهاند. پژوهشگران شروع به ساخت شبکههای بزرگتری از نورونها کردند و همزمان سازندگان سختافزارهایی مثل انویدیا پردازشگرهای خاصی را ساختند که این شبکهها را به شکل تصاعدی سریعتر میکند. نتیجهاش این بوده که چنین سیستمهایی خیلی بهتر از گذشته میتوانند کار کنند. اگر حجم بزرگی از تصاویر یا ویدئوها را در اختیار این سیستمها بگذارید، میتوانید به آنها آموزش بدهید که چهره افراد را هم تشخیص بدهند و بارها و بارها آن را شناسایی کنند.
عظیمترین مثال استفاده از این سیستمها را میتوان در مگافیس- پروژه دانشگاه واشینگتن- مشاهده کرد. این پروژه شامل نزدیک به 5 میلیون تصویر از ۶۷۲ هزار نفر میشد که از فلیکر جمعآوری شده بود. وقتی سیستم برای یافتن دو تصویر از یک فرد خاص از میان یک میلیون تصویر مورد آزمایش قرار گرفت، نتیجه این بود: اگر فقط یک شانس برای حدسزدن وجود داشته باشد، تا ۷۵ درصد احتمال درستبودن آن حدس وجود دارد. اگر شانس بیشتری (10 بار) برای حدسزدن وجود داشته باشد، تا ۹۰ درصد احتمال درستبودن آن وجود دارد.
ایرا کملماخر استاد دانشگاه واشینگتن و مسئول این پروژه میگوید: «ما نیاز داریم که تشخیص چهره را در ابعاد خیلی زیادی آزمایش کنیم تا کاربردهای عملی آن بیشتر شود و موفقیت یا ضعف الگوریتمهای تشخیصی آشکار شود.»
ویدئو که از تکنیکهای مشابهی برای بیحرکتکردن تصاویر استفاده میکند اما به قدرت پردازش بالاتری نیاز دارد نیز به هوش مصنوعی اجازه میدهد تا آنچه را که دارد در طول زمان رخ میدهد درک کند. بایدو در همین ماه آگوست گذشته اعلام کرد که در چالش اکتیویتینت پیروز شده و توانسته با 87.6 درصد موفقیت، کارهایی را که انسانها در 300 هزار ویدئو انجام میدهند تشخیص دهد و برچسب درست آن کار را روی ویدئو بزند. در آن ویدئوها انسانها در حال انجام کارهایی مثل چوببری، تمیز کردن پنجره، راهبردن سگ و فعالیتهای مشابه دیده میشدند.
فیسبوک هم از غولهایی است که به تکنولوژیهای این حوزه توجه زیادی نشان داده است تا بتواند تشخیص دهد که چهکسی در هر ویدئوی لایو استریم (پخش زنده) در فیسبوک حضور دارد و چهکاری را در آن انجام میدهد. سال گذشته یواکین کوینیونرو کاندلا رئیس بخش یادگیری کاربردی ماشینی گفت که حالت ایدهآل برای فیسبوک این است که بداند در هر ویدئوی لایو استریم دارد چه اتفاقی میافتد. این باعث میشود که فیسبوک قادر به هدایت کانالهای ویدئویی برای سلایق مختلف کاربران باشد و در عین حال برخی محتواها را کنترل کند.
تشخیص چهره در تصاویر بیحرکت و نیز در ویدئو حالا دارد به وضوح وارد دنیای حقیقی هم میشود و کاربردهای زیادی پیدا میکند. مثلا بایدو دارد برنامهای را آغاز میکند که در آن تشخیص چهره به جای کنترل بلیت به هنگام ورود به کنسرتها و مراسم مختلف مورد استفاده قرار میگیرد. مکان برگزاری مراسم از قبل مجهز به اطلاعات درباره مهمانها شده است و بنابراین سیستم میداند که شما چهکسی هستید. احتمالا این کار با استفاده از تصویری که شما در سایت آنها آپلود کردهاید یا از طریق پروفایلهای شما در شبکههای اجتماعی انجام میشود. به هر حال، وقتی وارد محل برگزاری مراسم میشوید سیستم میتواند تشخیص دهد که آیا اجازه ورود دارید یا نه.
امسال روش مشابهی در پاریس و در فرودگاه شارل دوگل به مدت سه ماه مورد آزمایش قرار گرفت. همچنین سال گذشته برنامهای مشابه در ژاپن پیاده شد اما نتایج هیچیک از این برنامهها به صورت عمومی مشخص نشده است.
در امریکا نیز این تکنولوژی کمکم و به شیوههای مختلف - ولی فعلا محدود- مورد استفاده قرار گرفته است. در چند هفته اخیر پلیس راهنمایی و رانندگی نیویورک اعلام کرد که با استفاده از تکنولوژی تشخیص چهره توانسته 4 هزار متخلف را بازداشت کند. در این روش، نرمافزاری مورد استفاده قرار میگیرد که تصاویر افراد متقاضی گواهینامه جدید رانندگی را با تصاویری که پیشتر در سیستم موجود بوده، مقایسه میکند. در چنین شرایطی، کار برای افراد جاعل که به دنبال سرقت هویت و استفاده از هویت دزدی برای گرفتن مدارک جدید مثل گواهینامه هستند سخت میشود. از آنجایی که مشکل سرقت هویت در امریکا بسیار شدید است، پیشرفتهای جدید میتواند کمک بزرگی به پلیس باشد. البته اگر اطلاعات نهتنها به صورت محلی و شهری، بلکه در سطح ایالتی یا فدرال در امریکا فراهم شود، تشخیصهای بسیار دقیقتری نیز به دست میآید. هوش مصنوعی هرچه اطلاعات وسیعتری در اختیار داشته باشد بهتر عمل میکند.
با این اوصاف به نظر میرسد که پیشرفت بیشتر در این حوزه هم چندان دور از دسترس نیست. اکسون -شرکتی که قبلا به عنوان تِیزر شناخته میشد و بزرگترین توزیعکننده دوربینهای بدنی پلیس در امریکا است- اخیرا تلاشهای زیادی را صورت داده تا هوش مصنوعی را با محصولات خود ترکیب کند و در این راستا، امسال دو شرکت در حوزه تکنولوژی هوش مصنوعی را خریداری کرده است.
ریک اسمیت مدیرعامل اکسون پیشتر در این خصوص گفته بود که مورد استفاده ایدهآل از هوش مصنوعی میتواند این باشد که پلیس در موارد مختلفی با کار از پشت میز بتواند مجرمان را در حوزههای مختلف با استفاده از تصاویر و تشخیص چهره، تعقیب کند. به گفته او، چنین سیستم گستردهای حتما در آینده مورد استفاده خواهد بود.
شرکت دیگری که در این حوزه فعال بوده، موتورولا است. موتورولا نیز دوربینهای بدنی میسازد و نرمافزار خود را با تکیه بر قابلیت آن برای شناخت سریع چهرهها ساخته است. چنین دوربینی مثلا میتواند به هنگام جستوجو برای کودکان دزدیدهشده مورد استفاده قرار بگیرد.
اما واضحترین نمودی که در خصوص سیستمهای تشخیص چهره وجود دارد، برای مردم عادی همان دوربینهایی است که در مکانهای عمومی کار گذاشته شدهاند. این دوربینها هم با استفاده از هوش مصنوعی وارد مراحل جدیدی خواهند شد. اینتل در همین ماه آوریل سال جاری اعلام کرد که سختافزاری برای دوربینهای امنیتی ساخته که قابلیت بررسی تراکم جمعیت، تشخیص چهره، شمارش افراد و برجستهنمایی تصویر را دارد و بر این اساس میتواند تحلیل شخصیت نیز انجام بدهد.
یک دوربین دیگر به نام دیانانکم هم ساخته شده که در همان حوزه یادگیری عمیق فعال است. این دوربین ضدآب و خودکفا است و اینطور گفته شده که همیشه و در هر حالی میتواند کارش را درست انجام دهد. یعنی مثلا میتوان این دوربین را در محیطی دورافتاده و کاملا عاری از امکانات برای برقراری اتصال اینترنتی قرار داد یا حتی آن را پشت صندوق در فروشگاهها نصب کرد تا مشتریان همیشگی را بشناسد و خدمات لازم را به آنها ارائه بدهد.
در این میان، مسئلهای که کمتر از همه مورد توجه قرار دارد این است که شهروندان قانونمداری که نمیخواهند چهرهشان در دوربینها ثبت شود و بعدا از آن در سیستمهای تشخیص هویت استفاده شود چه باید بکنند؟ میتوان گفت که کار خاصی از دست آنها برنمیآید. برخی پژوهشها نشان داده که راههایی برای گولزدن هوش مصنوعی و سیستم تشخیص چهره نیز وجود دارد؛ مثل طراحی عینکهای خاص یا بهکارگیری رنگهای خاصی روی چهره. چنین کارهایی ممکن است بتواند الگوریتمها را گول بزند و جلوی تشخیص چهره را بگیرد. اما همین کارها هم نیاز به شناخت عمیقی از نحوه کار الگوریتمهای تشخیص چهره دارد و کار هرکسی نیست. شاید اگرهر کسی کلاهی روی سرش بگذارد تازه بتواند کمی کار این الگوریتمها را دشوار کند.
ترجمه: فرحناز سالمی- آینده نگر
دیدگاه تان را بنویسید