زمان تخمینی مطالعه: 7 دقیقه
مشاهده خود و دیگران در حال کنترل و برقراری ارتباط با ماشینها با استفاده از صدای انسانی روز به روز در حال گسترش است. این تغییر رفتاری در نحوه تعامل ما با ارزشمندترین و قدرتمندترین ابزارها، پیامدهای عمیقی بر رابطه ما با فناوری و بسیاری از جنبههای جامعه داشته است. هوش مصنوعی و تعامل صوتی امروزه آغازگر تحویلی جدید در فناوری بشری شده است.
این حرکت اخیر به سمت دنیایی با کنترل صدا با ورود هوش مصنوعی مولد و مدلهای زبانی بزرگ(LLM) به شدت سرعت گرفته است. هوش مصنوعی مولد به جای مکالمات بیحرکت و اغلب خستهکنندهای که با ماشینهایی مانند الکسا یا سیری به آن عادت کردهایم، ارتباطات دو طرفه و بهطور طبیعی روان، حساس به زمینه را ارائه میدهد. یکی از افرادی که به دقت این مفاهیم را در نظر گرفته است، نویسنده و رئیس WillowTree، توبیاس دنگل است. دنگل در کتاب اخیر خود به نام «صدای آینده – عصر آینده فناوری صدا» راههایی را بررسی میکند که در آن جهان احتمالاً با از بین رفتن آخرین موانع فنی برای برنامهنویسی و کنترل ماشینها تغییر میکند.
چرا صدا تا این حد تحول آفرین است؟
دنگل استدلال میکند که تغییر در نحوه ارتباط ما با ماشینها پیامدهای بسیار گستردهتری دارد تا اینکه به ما اجازه بدهیم با ماشینها گفتگو کنیم. ماهیت متنی و روانتر زبان طبیعی به این معنی است که ما از فناوری بسیار کارآمدتر استفاده خواهیم کرد و برای بسیاری از مردم بسیار قابل دسترستر خواهد شد.
از نظر او «انسانها میتوانند سه برابر سریعتر از آنچه که روی صفحهکلید تایپ میکنند صحبت کنند – احتمالاً پنج برابر سریعتر از سرعتی که یک فرد معمولی میتواند روی دستگاه تلفن همراه تایپ کنند.”
“من به شما تضمین میدهم که وقتی کاری را انجام میدهید که سه دقیقه طول میکشد و اکنون میتوانید آن را در 15 ثانیه انجام دهید، جهان یک شبه تغییر خواهد کرد.”
موضع او این است که جهان به سرعت در حال تغییر به سمت اتخاذ مدلی است که در آن صدا رابط اصلی ما با ماشینها باشد. به عبارت دیگر، برای عملیات پیچیده ماشین – مانند برنامه نویسی کامپیوتری – دیگر نیازی به یادگیری زبان ماشینها نداریم زیرا آنها با ما صحبت میکنند. در اینجا مفهوم، دسترسی یک مسئله بزرگ است. حرکت به سمت صدا، تکنولوژی را دموکراتیک خواهد کرد، به این معنی که طیف وسیعتر و متنوعتری از افراد میتوانند سیستمهای پیچیدهای را برای حل مشکلات وارد کار کنند. موضع دنگل این است که این فقط به خاطر راحتی نیست. این یک تغییر اساسی در رابطه ما با فناوری است.
همانطور که او میگوید، “شما خواهید دید که اولویت هر رابطه بین انسانها و ماشینها به صدا تبدیل میشود.”
هوش مصنوعی و تعامل صوتی در عمل
یکی از نمونههای استفاده هوش مصنوعی و تعامل صوتی میتوان Cathay Pacific را نام برد که فناوری زبان طبیعی را در یک ابزار کمکی که برای کمک به تعمیر و نگهداری معمول و تمیز کردن هواپیما طراحی شده است، پیاده سازی کرده است. در این سیستم به طور مثال سیستم اعلانی به شکل «صندلی 13C دستهاش شکسته است» صادر میکند.
دنگل به عنوان مثالی از اینکه چگونه میتواند فناوریهای روزمره را متحول کند، او پیشنهاد میکند که برنامههای بانکی زمانی که کاربران بهجای پیمایش صدها عملکرد ممکن بر روی یک صفحه کوچک، به سادگی آنچه را که میخواهند بپرسند و به نتایجی دست یابند، بسیار بهبود خواهند یافت.
او همچنین به یکی از مشتریان WillowTree – یک تولید کننده بزرگ نوشابه – اشاره میکند که سیستمهای صوتی ایجاد کرده است که آنها را قادر میسازد قطعات جایگزین برای هر یک از دستگاهها یا توزیع کنندههای خود را در دستگاههای فروش خودکار یا رستورانها به سادگی با صدا سفارش دهند. این باعث صرفهجویی در ساعتهایی از زمان میشود که قبلاً هنگام جستجوی کاتالوگها برای کدهای مکان و اقلام استفاده میشد.
مسائل اخلاق و چالشها
تأثیری که این تغییر احتمالاً بر جامعه خواهد داشت به سختی قابل اغراق است. یکی از بزرگترین سوالات در مورد پیامدهای آن برای مشاغل و اشتغال انسان است. دنگل میگوید: «همه چیز به ما نشان میدهد که مشاغل بیشتری وجود خواهد داشت، اما اختلالاتی به وجود خواهد آمد و من فکر میکنم اینجا جایی است که تصمیمات سیاسی، دولت باید وارد شود و از آن حمایت کند.»
او معتقد است که نقشهایی مانند اپراتور مرکز تماس آشکارا در معرض خطر هستند که در حال حاضر توسط ابزارهای هوش مصنوعی محاورهای قابل انجام است. اما او استدلال میکند که این امر نه تنها با مشاغل جدید فرضی مانند مهندس فوری(prompt engineer) که ایجاد خواهد شد، بلکه با روشهای متعددی که از طریق آنها میتوانیم با استفاده از هوش مصنوعی ایجاد ارزش کنیم، جبران خواهد شد.
مسائل مطرح شده در مورد امنیت نیز به همان اندازه جدی است. قبلاً شاهد استفاده از جعل صوتی هوش مصنوعی توسط کلاهبرداران و باجگیران بودهایم. این خطر واقعی وجود دارد که با ارزانتر شدن و در دسترستر شدن هوش مصنوعی که منجر به قربانیان بیشتر میشود، این حملات بزرگ شوند. با این حال، دنگل در مورد نگرانیهای دور از ذهنی که گاهی اوقات مطرح میشود، چندان نگران نیست. او میگوید: “مردم در مورد هوش مصنوعی صحبت میکنند که در حال جنگیدن با انسانها هستند و من اصلا نگران این موضوع نیستم.”
آماده شدن برای آینده با قدرت هوش مصنوعی و تعامل صوتی
بنابراین چه کاری میتوانیم انجام دهیم تا مطمئن شویم برای این تغییر جهانی به سمت فناوریهای هوش مصنوعی و تعامل صوتی و مکالمههای زبان طبیعی با ماشینها آماده هستیم؟
دنگل پیشنهاد میکند که پاسخ در خود چالش نهفته است. این به معنای گرد هم آوردن تیمهای متشکل از فناوران، مهندسان، طراحان، کارشناسان ارتباطات و رهبران تجاری است. تمرکز اصلی آنها شناسایی فرصتها و ریسکهای بالقوه برای کسبوکار است که به آنها اجازه میدهد بهجای واکنشپذیری، بهطور فعالانه مدیریت شوند. او میگوید: «این همیشه اولین قدم است، زیرا شما شروع به تعریف آنچه ممکن است میکنید، اما آن را در چارچوب آنچه واقعبینانه است انجام میدهید، زیرا فنآوران خود را نیز درگیر کردهاید و سپس یک نقشه راه میسازید. “
این یک رویکرد “کارگاهی” است که توسط اپل پیشگام شده و توسط غولهای فناوری مختلف که خود را در خط مقدم موج نوظهور تحول یافتهاند، پذیرفته شده است. اما به همان اندازه برای هر کسب و کار یا سازمان آیندهنگر که نمیخواهد غافلگیر شود، کاربرد دارد. دنگل میگوید که اخیراً خطاب به گروهی از کارآموزان، به آنها گفت: “کاش من جای شما بودم – پنج سال آینده نوآوری بیشتری نسبت به پنج یا شاید 20 سال گذشته خواهد بود، زیرا هوش مصنوعی و تعامل صوتی و هوش مصنوعی مولد گرد هم میآیند. این فقط یک تجربه شگفت انگیز و یک زمان عالی است.”