زمان تخمینی مطالعه: 7 دقیقه

مشاهده خود و دیگران در حال کنترل و برقراری ارتباط با ماشین‌ها با استفاده از صدای انسانی روز به روز در حال گسترش است. این تغییر رفتاری در نحوه تعامل ما با ارزشمندترین و قدرتمندترین ابزارها، پیامدهای عمیقی بر رابطه ما با فناوری و بسیاری از جنبه‌های جامعه داشته است. هوش مصنوعی و تعامل صوتی امروزه آغازگر تحویلی جدید در فناوری بشری شده است.

این حرکت اخیر به سمت دنیایی با کنترل صدا با ورود هوش مصنوعی مولد و مدل‌های زبانی بزرگ(LLM) به شدت سرعت گرفته است. هوش مصنوعی مولد به جای مکالمات بی‌حرکت و اغلب خسته‌کننده‌ای که با ماشین‌هایی مانند الکسا یا سیری به آن عادت کرده‌ایم، ارتباطات دو طرفه و به‌طور طبیعی روان، حساس به زمینه را ارائه می‌دهد. یکی از افرادی که به دقت این مفاهیم را در نظر گرفته است، نویسنده و رئیس WillowTree، توبیاس دنگل است. دنگل در کتاب اخیر خود به نام «صدای آینده – عصر آینده فناوری صدا» راه‌هایی را بررسی می‌کند که در آن جهان احتمالاً با از بین رفتن آخرین موانع فنی برای برنامه‌نویسی و کنترل ماشین‌ها تغییر می‌کند.

چرا صدا تا این حد تحول آفرین است؟

دنگل استدلال می‌کند که تغییر در نحوه ارتباط ما با ماشین‌ها پیامدهای بسیار گسترده‌تری دارد تا اینکه به ما اجازه بدهیم با ماشین‌ها گفتگو کنیم. ماهیت متنی و روان‌تر زبان طبیعی به این معنی است که ما از فناوری بسیار کارآمدتر استفاده خواهیم کرد و برای بسیاری از مردم بسیار قابل دسترس‌تر خواهد شد.

از نظر او «انسان‌ها می‌توانند سه برابر سریع‌تر از آنچه که روی صفحه‌کلید تایپ می‌کنند صحبت کنند – احتمالاً پنج برابر سریع‌تر از سرعتی که یک فرد معمولی می‌تواند روی دستگاه تلفن همراه تایپ کنند.”

“من به شما تضمین می‌دهم که وقتی کاری را انجام می‌دهید که سه دقیقه طول می‌کشد و اکنون می‌توانید آن را در 15 ثانیه انجام دهید، جهان یک شبه تغییر خواهد کرد.”

موضع او این است که جهان به سرعت در حال تغییر به سمت اتخاذ مدلی است که در آن صدا رابط اصلی ما با ماشین‌ها باشد. به عبارت دیگر، برای عملیات پیچیده ماشین – مانند برنامه نویسی کامپیوتری – دیگر نیازی به یادگیری زبان ماشین‌ها نداریم زیرا آنها با ما صحبت می‌کنند. در اینجا مفهوم، دسترسی یک مسئله بزرگ است. حرکت به سمت صدا، تکنولوژی را دموکراتیک خواهد کرد، به این معنی که طیف وسیع‌تر و متنوع‌تری از افراد می‌توانند سیستم‌های پیچیده‌ای را برای حل مشکلات وارد کار کنند. موضع دنگل این است که این فقط به خاطر راحتی نیست. این یک تغییر اساسی در رابطه ما با فناوری است.

همانطور که او می‌گوید، “شما خواهید دید که اولویت هر رابطه بین انسانها و ماشین‌ها به صدا تبدیل می‌شود.”

هوش مصنوعی و تعامل صوتی در عمل

یکی از نمونه‌های استفاده هوش مصنوعی و تعامل صوتی می‌توان Cathay Pacific را نام برد که فناوری زبان طبیعی را در یک ابزار کمکی که برای کمک به تعمیر و نگهداری معمول و تمیز کردن هواپیما طراحی شده است، پیاده سازی کرده است. در این سیستم به طور مثال سیستم اعلانی به شکل «صندلی 13C دسته‌اش شکسته است» صادر می‌کند.

دنگل به عنوان مثالی از اینکه چگونه می‌تواند فناوری‌های روزمره را متحول کند، او پیشنهاد می‌کند که برنامه‌های بانکی زمانی که کاربران به‌جای پیمایش صدها عملکرد ممکن بر روی یک صفحه کوچک، به سادگی آنچه را که می‌خواهند بپرسند و به نتایجی دست یابند، بسیار بهبود خواهند یافت.

او همچنین به یکی از مشتریان WillowTree – یک تولید کننده بزرگ نوشابه – اشاره می‌کند که سیستم‌های صوتی ایجاد کرده است که آنها را قادر می‌سازد قطعات جایگزین برای هر یک از دستگاه‌ها یا توزیع کننده‌های خود را در دستگاه‌های فروش خودکار یا رستوران‌ها به سادگی با صدا سفارش دهند. این باعث صرفه‌جویی در ساعت‌هایی از زمان می‌شود که قبلاً هنگام جستجوی کاتالوگ‌ها برای کدهای مکان و اقلام استفاده می‌شد.

مسائل اخلاق و چالش‌ها

تأثیری که این تغییر احتمالاً بر جامعه خواهد داشت به سختی قابل اغراق است. یکی از بزرگترین سوالات در مورد پیامدهای آن برای مشاغل و اشتغال انسان است. دنگل می‌گوید: «همه چیز به ما نشان می‌دهد که مشاغل بیشتری وجود خواهد داشت، اما اختلالاتی به وجود خواهد آمد و من فکر می‌کنم اینجا جایی است که تصمیمات سیاسی، دولت باید وارد شود و از آن حمایت کند.»

او معتقد است که نقش‌هایی مانند اپراتور مرکز تماس آشکارا در معرض خطر هستند که در حال حاضر توسط ابزارهای هوش مصنوعی محاوره‌ای قابل انجام است. اما او استدلال می‌کند که این امر نه تنها با مشاغل جدید فرضی مانند مهندس فوری(prompt engineer) که ایجاد خواهد شد، بلکه با روش‌های متعددی که از طریق آنها می‌توانیم با استفاده از هوش مصنوعی ایجاد ارزش کنیم، جبران خواهد شد.

مسائل مطرح شده در مورد امنیت نیز به همان اندازه جدی است. قبلاً شاهد استفاده از جعل صوتی هوش مصنوعی توسط کلاهبرداران و باج‌گیران بوده‌ایم. این خطر واقعی وجود دارد که با ارزان‌تر شدن و در دسترس‌تر شدن هوش مصنوعی که منجر به قربانیان بیشتر می‌شود، این حملات بزرگ شوند. با این حال، دنگل در مورد نگرانی‌های دور از ذهنی که گاهی اوقات مطرح می‌شود، چندان نگران نیست. او می‌گوید: “مردم در مورد هوش مصنوعی صحبت می‌کنند که در حال جنگیدن با انسان‌ها هستند و من اصلا نگران این موضوع نیستم.”

آماده شدن برای آینده با قدرت هوش مصنوعی و تعامل صوتی

بنابراین چه کاری می‌توانیم انجام دهیم تا مطمئن شویم برای این تغییر جهانی به سمت فناوری‌های هوش مصنوعی و تعامل صوتی و مکالمه‌های زبان طبیعی با ماشین‌ها آماده هستیم؟

دنگل پیشنهاد می‌کند که پاسخ در خود چالش نهفته است. این به معنای گرد هم آوردن تیم‌های متشکل از فناوران، مهندسان، طراحان، کارشناسان ارتباطات و رهبران تجاری است. تمرکز اصلی آنها شناسایی فرصت‌ها و ریسک‌های بالقوه برای کسب‌وکار است که به آنها اجازه می‌دهد به‌جای واکنش‌پذیری، به‌طور فعالانه مدیریت شوند. او می‌گوید: «این همیشه اولین قدم است، زیرا شما شروع به تعریف آنچه ممکن است می‌کنید، اما آن را در چارچوب آنچه واقع‌بینانه است انجام می‌دهید، زیرا فن‌آوران خود را نیز درگیر کرده‌اید و سپس یک نقشه راه می‌سازید. “

این یک رویکرد “کارگاهی” است که توسط اپل پیشگام شده و توسط غول‌های فناوری مختلف که خود را در خط مقدم موج نوظهور تحول یافته‌اند، پذیرفته شده است. اما به همان اندازه برای هر کسب و کار یا سازمان آینده‌نگر که نمی‌خواهد غافلگیر شود، کاربرد دارد. دنگل می‌گوید که اخیراً خطاب به گروهی از کارآموزان، به آنها گفت: “کاش من جای شما بودم – پنج سال آینده نوآوری بیشتری نسبت به پنج یا شاید 20 سال گذشته خواهد بود، زیرا هوش مصنوعی و تعامل صوتی و هوش مصنوعی مولد گرد هم می‌آیند. این فقط یک تجربه شگفت انگیز و یک زمان عالی است.”

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *