بخشبندی تصویر Image Segmentation چیست؟
یکی از مهم ترین عملیات در بینایی کامپیوتر، بخشبندی تصویر یا Image Segmentation است. قطعهبندی تصویر فرآیند تقسیم یک تصویر به چندین قسمت یا ناحیه است که به یک کلاس تعلق دارند. این وظیفه خوشهبندی بر اساس معیارهای خاصی انجام میگردد و میتواند به عنوان مثال بر اساس رنگ یا بافت باشد. به این فرآیند […]
راهی سریع برای کنترل هوش مصنوعی به منظور عدم تولید جوابهای نامناسب و سمی
محققان یک مدل یادگیری ماشینی کنجکاو برای کنترل هوش مصنوعی و به خصوص چت باتها ایجاد کردهاند که طیف گستردهتری از اعلانات(Prompt) را برای آموزش یک ربات چت برای جلوگیری از خروجیهای نفرت انگیز یا مضر پیدا میکند. در حالت کلی یک کاربر میتواند از چت باتهایی مانند ChatGPT بخواهد یک برنامه کامپیوتری بنویسد یا […]
شناسایی الگو Pattern Recognition چیست؟
شناسایی الگو(Pattern Recognition) توانایی ماشینها برای تشخیص الگو در دادهها و سپس استفاده از آن الگوها برای تصمیمگیری یا پیشبینی با استفاده از الگوریتمهای کامپیوتری است. این موضوع یک جزء حیاتی از سیستمهای هوش مصنوعی مدرن (AI) است. این مقاله یک نمای کلی از مهمترین تکنیکهای مورد استفاده برای شناسایی الگوها و برنامههای کاربردی در […]
هوش مصنوعی و مبارزه با باکتریها جایی که آنتی بیوتیکها کم میآورند!!
اکثر آنتی بیوتیکها باکتریهای فعال متابولیک را هدف قرار میدهند، اما هوش مصنوعی میتوان به مبارزه با باکتریهای مختلف کمک شایانی بکند. با این دستاورد محققان میتوانند ترکیباتی را که برای میکروبهای خفته(dormant) کشنده هستند، به طور موثر بررسی کنند. از دهه 1970، اکتشاف آنتی بیوتیک مدرن با سکون روبرو شده است. امروزه سازمان بهداشت […]
شبکه عصبی کانولوشن CNN را بیشتر بشناسیم!!
در این مقاله، شبکه عصبی کانولوشن (Convolutional Neural Network) را که یک عنصر کلیدی در بینایی کامپیوتری و پردازش تصویر است را بررسی خواهیم کرد. این مقاله برای تمامی افراد چه یک فرد مبتدی باشید و یا یک متخصص با تجربه میتواند مفید باشد. همچنین این مقاله اطلاعاتی در مورد مکانیک شبکههای عصبی مصنوعی و […]
مفهوم تشخیص اشیاء Object Detection در پردازش تصویر
این مقاله مقدمهای بر تشخیص اشیا و مروری بر پیشرفتهترین الگوریتمهای تشخیص اشیا در بینایی کامپیوتری ارائه میدهد. تشخیص اشیا یک زمینه کلیدی در هوش مصنوعی است که به سیستمهای کامپیوتری اجازه میدهد تا با تشخیص اشیاء در تصاویر یا ویدئوهای بصری، محیط خود را ببینند. در این مقاله به طور خاص، با موارد زیر […]
بازسازی دیجیتالی هندسه سه بعدی با کیفیت بالا از یک تصویر تک رنگ
بازسازی دیجیتالی هندسه سه بعدی از تصاویر یک مشکل اساسی در بینایی کامپیوتر است. کاربردهای مختلفی برای این حوزه مانند تولید فیلم، تولید محتوا برای بازیهای ویدئویی، واقعیت مجازی و افزوده، چاپ سه بعدی و بسیاری دیگر از زمینهها وجود دارد. وظیفه مورد بحث در این مطلب، بازسازی هندسه سه بعدی با کیفیت بالا از […]
طبقهبندی تصویر Image Classification و مفاهیم کلی آن
الکتروهایو در این مقاله همه چیزهایی را که باید در مورد طبقهبندی تصویر(کلاسبندی تصویر) بدانید را پوشش میدهد که در واقع وظیفه بینایی رایانه برای شناسایی چیزی است که یک تصویر نشان میدهد. امروزه استفاده از شبکههای عصبی کانولوشن (CNN) روشی پیشرفته برای Image Classification است. چرا طبقهبندی تصاویر مهم است؟ ما امروزه در عصر […]
آموزش استدلال با شبکههای ماژول عصبی (Neural Module Networks)
آموزش استدلال با شبکههای ماژول عصبی (Neural Module Networks) موضوعی مهم در مبحث یادگیری مبتنی بر شبکههای عصبی را در بر میگیرد. فرض کنید ما در حال ساخت یک ربات خانگی هستیم و میخواهیم این ربات بتواند به سؤالات پیرامون خود پاسخ دهد. ممکن است سوالاتی مانند این بپرسیم: چگونه میتوانیم اطمینان حاصل کنیم که […]
تفاوت تصویر، عکس و نگاره چیست؟
امروزه، اکثر مردم هنگام بحث در مورد نمایش بصری یک شی در رایانه، تفاوت تصویر، عکس و نگاره را نمیدانند و آنها را مترادف هم در نظر میگیرند. اما برای ابهام هر یک از این موارد را به صورت زیر تعریف میکنیم. تصاویر دیجیتال(Images)، عکسها(Photos) و نگارهها(Pictures) تصویر بالا نمونهای بصری از تفاوت تصویر، عکس […]
تشخیص صدا Voice Recognition چیست؟
تشخیص صدا یا گوینده توانایی یک ماشین یا برنامه برای دریافت و تفسیر دیکته یا درک و اجرای دستورات گفتاری است. تشخیص صدا و گفتار یکی از داغترین موضوعات در فناوری امروزی است. این مفاهیم با اینکه از نظر اسم مشابه هستند اما یک تفاوت اساسی بین آنها وجود دارد.به طور خلاصه، تشخیص گفتار رایانه […]
تشخیص گفتار Speech Recognition چیست؟
تشخیص گفتار یا گفتار به متن(speech-to-text)، توانایی یک ماشین یا برنامه برای شناسایی کلمات گفته شده و تبدیل آنها به متن قابل خواندن است. نرم افزارهای تشخیص گفتار ابتدایی دایره واژگان محدودی داشتند و ممکن بود تنها زمانی کلمات و عبارات را شناسایی کنند که به وضوح گفته شود. نرم افزارهای پیچیدهتر امروزی میتواند گفتار […]
APIهای برتر بینایی کامپیوتر در سال 2024
این مقاله APIهای برتر بینایی کامپیوتر را برای شناسایی تصویر، تشخیص اشیا، طبقهبندی تصویر و موارد دیگر پوشش میدهد. امروزه شرکتهای مهندسی و تحقیقاتی مدرن از بینایی کامپیوتر استفاده میکنند تا ماشینها بتوانند ببینند و بینایی انسان را تقلید کنند. بنابراین، API های متعددی برای تسهیل پردازش و شناسایی تصویر در برنامههای کاربردی ابری توسعه […]
مفهوم شناسایی تصویر Image Recognition مبانی و کاربرد آن
شناسایی تصویر وظیفه شناخت اشیاء مورد علاقه در یک تصویر و تشخیص اینکه تصویر متعلق به کدام دسته است را بر عهده دارد. در حالت کلی شناسایی تصویر(Image recognition)، شناسایی عکس(photo recognition) و شناسایی نگاره(picture recognition) اصطلاحاتی هستند که به جای یکدیگر استفاده میشوند. هنگامی که به صورت بصری یک شی یا صحنه را میبینیم، […]
خزنده وب Web Crawler چیست؟
تعریف خزنده وب خزنده وب یک ربات موتور جستجوی دیجیتال است که از کپی و ابرداده(Metadata) برای کشف و فهرستبندی صفحات سایت استفاده میکند. این مفهوم همچنین به عنوان ربات عنکبوتی(اسپایدر) نیز نامیده میشود، وب کراولرها در وب جهانی (از این رو “عنکبوت” و “خزنده”) میخزند تا بفهمد یک صفحه مشخص در مورد چیست. سپس […]
PyTorchVideo ابزاری برای درک ویدیو با یادگیری عمیق
PyTorchVideo یک کتابخانه یادگیری عمیق کارآمد، منعطف و ماژولار جدید برای تحقیقات در حوزه درک ویدیو است. این کتابخانه با استفاده از PyTorch ساخته شده است و مجموعه کاملی از ابزارهای درک ویدیو را پوشش میدهد، و به انواع برنامههای کاربردی برای درک ویدیو قابلیت مقیاس شدن را دارد. در این مقاله یک نمای کلی […]