ربات دیسکورد Stable Artisan ابزاری جدید برای تولید و ویرایش تصویر
شرکت Stability AI از ربات دیسکورد Stable Artisan رونمایی کرد که امکان تولید و ویرایش یکپارچه انواع رسانه را فراهم میکند. این ربات Discord مدلهای پیشرفته هوش مصنوعی را ادغام میکند و به کاربران این امکان را میدهد تا تصاویر و ویدیوهای با کیفیت بالا را بدون زحمت بسازند. بیایید به ویژگیها و عملکردهای انقلابی […]
ارزیابی مدل بینایی کامپیوتر چگونه است؟
بینایی کامپیوتر به سرعت به یکی از اجزای اساسی فناوری مدرن تبدیل شده است و صنایعی مانند خرده فروشی، لجستیک، مراقبتهای بهداشتی، رباتیک و وسایل نقلیه خودران را متحول کرده است. همانطور که این مدلها به تکامل خود ادامه میدهند، ارزیابی مدل بینایی کامپیوتر و کارآمدی آنها بسیار مهم است. معیارهای کلیدی ارزیابی مدل بینایی […]
آیا موتور جستجوی OpenAI در 13 مه منتشر خواهد شد؟
با نزدیکتر شدن به 13 می، بر اساس گمانهزنیها، موتور جستجوی OpenAI که مبتنی بر هوش مصنوعی است انتظار میرود که همه را در شگفتی دیگری غرق کند. قبل از اینکه این موتور جستجو انتشار یابد، انتظار داریم خلاصههای کاملی از کارهایی که میتواند انجام دهد و چگونه فناوری جستجو را تغییر خواهد داد تا […]
نقص نیورالینک Neuralink در اولین کارآزمایی انسانی!! آیا ایلان ماسک شکست خورده است؟
آخرین اخبار در مورد نرورالینک که شرکت فناوری عصبی ایلان ماسک(Neuralink) است نشان میدهد که اولین آزمایش انسانی کاشت یک تراشه مغزی بر روی یک مرد 29 ساله به نام Noland Arbaugh انجام داد. اما در این فرآیند یک نقص غیرمنتظره رخ داد که باعث شد شرکت این مشکل را اصلاح کرده و تجربه خود […]
مدلهای زبان بینایی VLM چیست؟
مدلهای زبان بینایی (Vision language Models) نوعی مدل هوش مصنوعی هستند که قابلیتهای بینایی کامپیوتری (CV) و پردازش زبان طبیعی (NLP) را ترکیب میکنند. این مدلها برای درک و تولید متن در مورد تصاویر طراحی شدهاند و شکاف بین اطلاعات بصری و توضیحات زبان طبیعی را پر میکنند. VLM ها میتوانند وظایف مختلفی را انجام […]
مدل هوش مصنوعی AlphaFold 3 ساختار و برهمکنشهای همه مولکولهای حیات را پیشبینی میکند
مدل هوش مصنوعی AlphaFold 3، دستاورید جدیدی است که توسط Google DeepMind و Isomorphic Labs توسعه یافته است. این مدل جدید با قابلیتهای خود در پیشبینی دقیق ساختار پروتئینها، DNA، RNA، لیگاندها و موارد دیگر و نحوه تعامل آنها، امیدواریم که درک کنونی از دنیای بیولوژیکی و کشف دارو را تغییر دهد. در داخل هر […]
مدلهای چندوجهی Multimodal Models چیست؟
مقدمه به دنیای جذاب مدلهای چند وجهی خوش آمدید! دنیایی که به عنوان یک رویکرد پیشگامانه ظهور کردهاند و نحوه فهم و درک ماشینها از جهان را متحول کردند. با ترکیب نقاط قوت بینایی کامپیوتر و پردازش زبان طبیعی (NLP)، مدلهای چندوجهی فرصتهای جدیدی را برای ماشینها برای تعامل با محیط به شیوهای شبیه به […]
مدل هوش مصنوعی VILA محصولی جدید حاصل همکاری MIT و انویدیا
هوش مصنوعی (AI) هر روزی که طی میشود به تکامل خود ادامه میدهد و با گسترش آن مدلهایی را میطلبد که قادر به مدیریت مجموعه دادههای گسترده و ارائه بینش دقیق هستند. برای برآوردن این نیازها، محققان NVIDIA و MIT اخیراً در یک همکاری مشترک یک مدل زبان بصری (VLM) با نام هوش مصنوعی VILA […]
بینایی کامپیوتر در رباتیک آغازگر انقلابی در خودمختاری
یکی از کاربردهای مهم بینایی کامپیوتر که همه ما بیشتر از همه چیز در مورد آن هیجان زده میشویم، رشته رباتیک است. با الحاق تکنولوژیهای بینایی کامپیوتر، پردازش زبان طبیعی، مکانیک و فیزیک، شاهد تغییراتی شگرفی در رشته رباتیک خواهیم بود و بینایی کامپیوتر در رباتیک میتواند آغازگر انقلابی عظیم در خودمختاری محسوب شود. بینایی […]
محلیسازی شی Object Localization چیست؟
محلیسازی شی و تصویر یکی از مهمترین وظایف در بینایی کامپیوتری (CV) است. در Object Localization، الگوریتم یک شی را در یک تصویر شناسایی و محلیسازی میکند. از طرف دیگر، محلیسازی تصویر سعی میکند تمام اشیاء را در یک تصویر مشخص محلیسازی کند. کاربردهای مختلفی از محلیسازی شی وجود دارد. شناسایی افراد (نظارت)، شناسه وسیله […]
آیا هوش مصنوعی خودآگاه روزی ممکن میشود؟
ایلیا سوتسکور، دانشمند ارشد OpenAI و یوشوا بنجیو، برنده تست تورینگ، این احتمال را رد نمیکنند که هوش مصنوعی خودآگاه روزی به واقعیت بدل خواهد شد. این ایده که هوش مصنوعی ممکن است روزی خودآگاه(conscious) باشد مدتهاست که موضوعی علمی تخیلی بوده است، اما برخی از محققان شروع به جدی گرفتن این مفهوم کردهاند. اخیراً […]
اولین مسابقه اتومبیلرانی خودران جهان در یاس مارینا ابوظبی برگزار شد
آیا میتوانید یک مسابقه اتومبیلرانی بدون راننده را تصور کنید؟ خوب، این موضوع دیگر تخیل نیست،و اکنون به لطف هوش مصنوعی به یک واقعیت بدل شده است! درست است، جهان شاهد اولین مسابقه اتومبیلرانی خودران حرفهای در هفته اخیر بود. لیگ اتومبیلرانی خودمختار ابوظبی (A2RL) که در یاس مارینا برگزار شد، جهشی قابل توجه در […]
با بینایی کامپیوتر سه بعدی 3D Computer Vision آشنا شوید!!!
بینایی کامپیوتر سه بعدی شاخهای از علوم کامپیوتر است که بر روی ثبت، پردازش تصویر و تجزیه و تحلیل دادههای بصری سه بعدی تمرکز دارد. هدف این مفهوم بازسازی و درک ساختار سه بعدی اشیاء و صحنهها از تصاویر دو بعدی یا دادههای ویدیویی است. تکنیکهای بینایی سهبعدی از اطلاعات منابعی مانند دوربینها یا حسگرها […]
ردیابی اشیاء Object Tracking در بینایی کامپیوتر
ردیابی اشیاء وظیفه شناسایی خودکار اشیاء در یک ویدیو و تفسیر آنها به عنوان مجموعهای از مسیرها با دقت بالا است. الگوریتمهای ردیابی اشیاء(Object Tracking) پس از تشخیص اشیاء در صحنه، شناسهای منحصر به فرد به هر شی تخصیص داده و سپس اشیاء شناسایی شده را در فریمهای یک ویدیو ردیابی میکند. اغلب، نشانهای در […]
تشخیص گردباد با استفاده از مجموعه دادههای هوش مصنوعی
TorNet، یک مجموعه داده عمومی هوش مصنوعی برای تشخیص گردباد است که میتواند به مدلهای هواشناسی کمک کند تا زمان و چرایی شکلگیری گردبادها را مشخص کنند و توانایی سیستمهای پیشیابی را در صدور هشدارها بهبود بخشد. با بازگشت بهار در نیمکره شمالی فصل گردباد در آمریکای شمالی فرا میرسد. قیف پیچنده گرد و غبار […]
ثبت تصویر Image Registration و کاربردهای آن
در بسیاری از برنامههای بینایی کامپیوتری (مانند ردیابی اشیاء و تصویربرداری پزشکی) نیاز به تراز کردن دو یا چند تصویر از یک شی (یا صحنه) از دیدگاهها با زاویههای مختلف، در زمانهای مختلف یا در شرایط مختلف وجود دارد. الگوریتمهای ثبت تصویر(Image Registration) در عمل یک تصویر داده شده (تصویر مرجع) را به تصویر دیگری […]