زمان تخمینی مطالعه: 6 دقیقه

معرفی

بازار فعلی هوش مصنوعی، به ویژه در دنیای هوش مصنوعی مولد، با راه اندازی ChatGPT-4 توسط OpenAI در سال 2023 و Claude 3 از Anthropic AI در اوایل این ماه، در حال رونق است. این مدل‌ها کار توسعه دهندگان محتوا را آسان می‌کنند و اکنون با ظهور Devin یک مهندس نرم افزار تمام و کمال وارد رقابت با مدل‌های دیگر شده است. چند روز پیش، شرکت Cognition مدل Devin، اولین مهندس نرم‌افزار کاملاً مستقل هوش مصنوعی در جهان را منتشر کرد و استاندارد جدیدی را در معیار کدنویسی SWE-Bench ایجاد کرد. تنها با یک اعلان، دوین می‌تواند مانند یک مهندس نرم‌افزار انسانی، کد بنویسد یا وب‌ سایت ایجاد کند. در این بخش قبل از اینکه کمی عمیق‌تر به مدل Devin بپردازیم، خود را با خالق آن – Cognition – آشنا خواهیم کرد.

شرکت Cognitive

شرکت Cognition که در نوامبر 2023 تأسیس شد، یک آزمایشگاه کاربردی هوش مصنوعی مستقر در ایالات متحده است که بر استدلال متمرکز است. آنها قصد دارند با استفاده از استدلال، رشته‌های زیادی را وارد هوش مصنوعی کنند. در حال حاضر Cognition شامل متخصصان و رهبرانی است که با غول‌های فناوری مانند Google DeepMind، Cursor، Scale AI و Nuro کار کرده‌اند. آنها قبلاً 21 میلیون دلار به رهبری صندوق بنیانگذاران پیتر تیل دریافت کرده‌اند. Cognition توسط غول‌هایی مانند Tony Xu، مدیر عامل DoorDash، و Fred Ehrsam، بنیانگذار Coinbase، یک پلت‌فرم رمز ارز، پشتیبانی می‌شود.

Devin چیست؟

Devin یک مدل مستقل است که می‌تواند کدهای پیچیده و وظایف مهندسی نرم افزار را با یک اعلان ساده برنامه‌ریزی، تجزیه و تحلیل و اجرا کند. این خط فرمان، یک ویرایشگر کد و یک مرورگر وب جداگانه دارد. قابلیت‌های این مدل با آزمایش Meta’s Llama 2 روی چند ارائه‌دهنده API مختلف نشان داده شد. دیوین ابتدا یک “طرح” گام به گام قبل از حل مشکل ایجاد کرد. سپس کل پروژه را با استفاده از همان ابزارهایی که یک مهندس نرم افزار انسانی انجام می‌داد، ساخت. Devin با استفاده از مرورگر داخلی خود توانست اسناد API را برای خواندن و یادگیری نحوه پلاگین کردن به هر یک از این APIها جمع آوری کند. در نهایت، یک وب‌سایت با استایل کامل ساخت و راه‌اندازی کرد.

چیزی که Devin را متمایز می‌کند، توانایی آن در یادگیری از اشتباهات است. این مدل می‌تواند هزاران تصمیم بگیرد و با گذشت زمانو با کسب تجربیات از شکست‌های خود کم کم بهتر می‌شود. این مدل هنگامی که روی چند مجموعه استاندارد از مشکلات مهندسی نرم افزار آزمایش شد، از راه حل‌های دیگر موجود عملکرد بهتری داشت. دوین همچنین با برندهای برتر فناوری در مورد وظایف هوش مصنوعی مصاحبه‌هایی انجام داد و انتظارات آن را برآورده کرد. همچنین وظایف مربوط به مشاغل واقعی ارسال شده در Upwork را تکمیل کرده است، مانند وظایف کدنویسی، اشکال زدایی مدل‌های بینایی کامپیوتری، و تولید گزارش‌های دقیق.

با استفاده از Devin برنامه نویسان می‌توانند دستورات را به کد قابل اجرا تبدیل کنند. این کد نویس هوش مصنوعی نه تنها می‌تواند تکه‌های کد را تکمیل کند، بلکه می‌تواند آنها را به چندین زبان ترجمه کند.

مقایسه Devin با مدل‌های دیگر

دوین روی SWE-bench آزمایش شده است، یک پلتفرم محک(benchmarking) که به نمایندگان وظیفه می‌دهد تا مسائل دنیای واقعی را در پروژه‌های منبع باز حل کنند، که بیشتر توسط مهندسان نرم‌افزار استفاده می‌شود. بر اساس گفته Cognition، دوین بر اساس 25٪ زیرمجموعه تصادفی از مجموعه داده مورد ارزیابی قرار گرفت. دوین 13.86 درصد از مشکلات را به درستی حل کرده است، که یک جهش بزرگ در برابر Claude 2 با 4.8 درصد و ChatGPT-4 با 1.74 درصد است. Cognition اظهار داشت که به زودی گزارش فنی دقیق‌تری را منتشر خواهد کرد.

نتایج بنچمارک SEW برای مقایسه Devin با مدل‌های دیگر

آیا Devin جایگزین مهندس نرم افزار می‌شود؟

خوب رسیدیم به سوال اصلی این مقاله که آیا Devin می‌تواند پا جای مهندسین نرم افزار بگذارد و جای آنها را بگیرد؟ اعداد و نتایج چشمگیر، همانطور که در بنچمارک مشاهده می‌شود، باعث آشفتگی در ذهن مردم، به ویژه توسعه دهندگان و مهندسان نرم افزار، در مورد آینده مشاغل نرم افزاری و موارد مرتبط شده است. Cognition می‌گوید: «دوین یک هم تیمی خستگی ناپذیر و ماهر است که به همان اندازه آماده است تا در کنار شما کار کند یا به طور مستقل وظایفی را برای شما انجام دهد تا بررسی شوند. با دوین، مهندسان می‌توانند روی مسائل جالب‌تر تمرکز کنند و تیم‌های مهندسی می‌توانند برای اهداف بلندپروازانه‌تری تلاش کنند.به نظر خنده دار است، زیرا بسیاری تصور می‌کنند که Devin پایان بسیاری از مهندسان نرم افزار است، Cognition، سازندگان Devin، به طور فعال مهندسان نرم افزار “انسانی” را استخدام می‌کند! نظرات متفاوت است و تا زمانی که دوین به طور کامل آزمایش نشود، نمی‌توانیم به نتیجه ای برسیم.

همانطور که آندری کارپاتی، مدیر سابق هوش مصنوعی در تسلا، نقل می‌کند: «از نظر من، خودکارسازی مهندسی نرم‌افزار شبیه به رانندگی خودکار خواهد بود». او ادامه می‌دهد که مهندسی نرم افزار در مسیر تغییر اساسی قرار دارد. این امر مستلزم اتوماسیون بسیار نظارت‌شده‌تر در هنگام اجرای دستورات، ایده‌ها یا استراتژی‌های پیشرفت در سطح بالا به زبان انگلیسی است. درست مانند هر ابزار هوش مصنوعی مولد دیگری، دوین تنها می‌تواند به خوبی فردی باشد که از آن استفاده می‌کند! اینها فقط ابزارهایی هستند که در دست یک کاربر کارآمد است که باعث می‌شود کارهای او بسیار سخت‌تر و وقت گیرتر شود!

نتیجه گیری

هوش مصنوعی دوین یک گام بزرگ رو به جلو در قلمرو هوش مصنوعی مولد است که با خودکار کردن وظایف کدنویسی و مشکلات پیچیده، زمینه توسعه نرم‌افزار را متحول کرده است. با مدل‌هایی مانند GPT-4، Claude 3، و در حال حاضر دوین، آینده در حوزه هوش مصنوعی مولد امیدوارکننده به نظر می‌رسد. این مدل‌ها به وجود نیامده‌اند تا جایگزین ما شوند، بلکه برای کمک به ما اینجا هستند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *