زمان تخمینی مطالعه: 6 دقیقه
معرفی
بازار فعلی هوش مصنوعی، به ویژه در دنیای هوش مصنوعی مولد، با راه اندازی ChatGPT-4 توسط OpenAI در سال 2023 و Claude 3 از Anthropic AI در اوایل این ماه، در حال رونق است. این مدلها کار توسعه دهندگان محتوا را آسان میکنند و اکنون با ظهور Devin یک مهندس نرم افزار تمام و کمال وارد رقابت با مدلهای دیگر شده است. چند روز پیش، شرکت Cognition مدل Devin، اولین مهندس نرمافزار کاملاً مستقل هوش مصنوعی در جهان را منتشر کرد و استاندارد جدیدی را در معیار کدنویسی SWE-Bench ایجاد کرد. تنها با یک اعلان، دوین میتواند مانند یک مهندس نرمافزار انسانی، کد بنویسد یا وب سایت ایجاد کند. در این بخش قبل از اینکه کمی عمیقتر به مدل Devin بپردازیم، خود را با خالق آن – Cognition – آشنا خواهیم کرد.
شرکت Cognitive
شرکت Cognition که در نوامبر 2023 تأسیس شد، یک آزمایشگاه کاربردی هوش مصنوعی مستقر در ایالات متحده است که بر استدلال متمرکز است. آنها قصد دارند با استفاده از استدلال، رشتههای زیادی را وارد هوش مصنوعی کنند. در حال حاضر Cognition شامل متخصصان و رهبرانی است که با غولهای فناوری مانند Google DeepMind، Cursor، Scale AI و Nuro کار کردهاند. آنها قبلاً 21 میلیون دلار به رهبری صندوق بنیانگذاران پیتر تیل دریافت کردهاند. Cognition توسط غولهایی مانند Tony Xu، مدیر عامل DoorDash، و Fred Ehrsam، بنیانگذار Coinbase، یک پلتفرم رمز ارز، پشتیبانی میشود.
Devin چیست؟
Devin یک مدل مستقل است که میتواند کدهای پیچیده و وظایف مهندسی نرم افزار را با یک اعلان ساده برنامهریزی، تجزیه و تحلیل و اجرا کند. این خط فرمان، یک ویرایشگر کد و یک مرورگر وب جداگانه دارد. قابلیتهای این مدل با آزمایش Meta’s Llama 2 روی چند ارائهدهنده API مختلف نشان داده شد. دیوین ابتدا یک “طرح” گام به گام قبل از حل مشکل ایجاد کرد. سپس کل پروژه را با استفاده از همان ابزارهایی که یک مهندس نرم افزار انسانی انجام میداد، ساخت. Devin با استفاده از مرورگر داخلی خود توانست اسناد API را برای خواندن و یادگیری نحوه پلاگین کردن به هر یک از این APIها جمع آوری کند. در نهایت، یک وبسایت با استایل کامل ساخت و راهاندازی کرد.
چیزی که Devin را متمایز میکند، توانایی آن در یادگیری از اشتباهات است. این مدل میتواند هزاران تصمیم بگیرد و با گذشت زمانو با کسب تجربیات از شکستهای خود کم کم بهتر میشود. این مدل هنگامی که روی چند مجموعه استاندارد از مشکلات مهندسی نرم افزار آزمایش شد، از راه حلهای دیگر موجود عملکرد بهتری داشت. دوین همچنین با برندهای برتر فناوری در مورد وظایف هوش مصنوعی مصاحبههایی انجام داد و انتظارات آن را برآورده کرد. همچنین وظایف مربوط به مشاغل واقعی ارسال شده در Upwork را تکمیل کرده است، مانند وظایف کدنویسی، اشکال زدایی مدلهای بینایی کامپیوتری، و تولید گزارشهای دقیق.
با استفاده از Devin برنامه نویسان میتوانند دستورات را به کد قابل اجرا تبدیل کنند. این کد نویس هوش مصنوعی نه تنها میتواند تکههای کد را تکمیل کند، بلکه میتواند آنها را به چندین زبان ترجمه کند.
مقایسه Devin با مدلهای دیگر
دوین روی SWE-bench آزمایش شده است، یک پلتفرم محک(benchmarking) که به نمایندگان وظیفه میدهد تا مسائل دنیای واقعی را در پروژههای منبع باز حل کنند، که بیشتر توسط مهندسان نرمافزار استفاده میشود. بر اساس گفته Cognition، دوین بر اساس 25٪ زیرمجموعه تصادفی از مجموعه داده مورد ارزیابی قرار گرفت. دوین 13.86 درصد از مشکلات را به درستی حل کرده است، که یک جهش بزرگ در برابر Claude 2 با 4.8 درصد و ChatGPT-4 با 1.74 درصد است. Cognition اظهار داشت که به زودی گزارش فنی دقیقتری را منتشر خواهد کرد.
آیا Devin جایگزین مهندس نرم افزار میشود؟
خوب رسیدیم به سوال اصلی این مقاله که آیا Devin میتواند پا جای مهندسین نرم افزار بگذارد و جای آنها را بگیرد؟ اعداد و نتایج چشمگیر، همانطور که در بنچمارک مشاهده میشود، باعث آشفتگی در ذهن مردم، به ویژه توسعه دهندگان و مهندسان نرم افزار، در مورد آینده مشاغل نرم افزاری و موارد مرتبط شده است. Cognition میگوید: «دوین یک هم تیمی خستگی ناپذیر و ماهر است که به همان اندازه آماده است تا در کنار شما کار کند یا به طور مستقل وظایفی را برای شما انجام دهد تا بررسی شوند. با دوین، مهندسان میتوانند روی مسائل جالبتر تمرکز کنند و تیمهای مهندسی میتوانند برای اهداف بلندپروازانهتری تلاش کنند.به نظر خنده دار است، زیرا بسیاری تصور میکنند که Devin پایان بسیاری از مهندسان نرم افزار است، Cognition، سازندگان Devin، به طور فعال مهندسان نرم افزار “انسانی” را استخدام میکند! نظرات متفاوت است و تا زمانی که دوین به طور کامل آزمایش نشود، نمیتوانیم به نتیجه ای برسیم.
همانطور که آندری کارپاتی، مدیر سابق هوش مصنوعی در تسلا، نقل میکند: «از نظر من، خودکارسازی مهندسی نرمافزار شبیه به رانندگی خودکار خواهد بود». او ادامه میدهد که مهندسی نرم افزار در مسیر تغییر اساسی قرار دارد. این امر مستلزم اتوماسیون بسیار نظارتشدهتر در هنگام اجرای دستورات، ایدهها یا استراتژیهای پیشرفت در سطح بالا به زبان انگلیسی است. درست مانند هر ابزار هوش مصنوعی مولد دیگری، دوین تنها میتواند به خوبی فردی باشد که از آن استفاده میکند! اینها فقط ابزارهایی هستند که در دست یک کاربر کارآمد است که باعث میشود کارهای او بسیار سختتر و وقت گیرتر شود!
نتیجه گیری
هوش مصنوعی دوین یک گام بزرگ رو به جلو در قلمرو هوش مصنوعی مولد است که با خودکار کردن وظایف کدنویسی و مشکلات پیچیده، زمینه توسعه نرمافزار را متحول کرده است. با مدلهایی مانند GPT-4، Claude 3، و در حال حاضر دوین، آینده در حوزه هوش مصنوعی مولد امیدوارکننده به نظر میرسد. این مدلها به وجود نیامدهاند تا جایگزین ما شوند، بلکه برای کمک به ما اینجا هستند.