زمان تخمینی مطالعه: 6 دقیقه
TorNet، یک مجموعه داده عمومی هوش مصنوعی برای تشخیص گردباد است که میتواند به مدلهای هواشناسی کمک کند تا زمان و چرایی شکلگیری گردبادها را مشخص کنند و توانایی سیستمهای پیشیابی را در صدور هشدارها بهبود بخشد. با بازگشت بهار در نیمکره شمالی فصل گردباد در آمریکای شمالی فرا میرسد. قیف پیچنده گرد و غبار و آوار، منظرهای غیرقابل انکار در این قسمت از جغرافیای جهان است.علائم شکلگیری چنین بلایای طبیعی میتوان برای رادارها و ابزارهای هواشناسی پنهان باشد و سخت است که بدانیم دقیقاً چه زمانی یک گردباد شکل گرفته است یا حتی چرا شکل گرفته است.
استفاده از یک مجموعه داده جدید میتواند پاسخها به این موضوع را در خود جای دهد. این مجموعه داده شامل دادههای آماری راداری از هزاران گردباد است که در 10 سال گذشته به ایالات متحده برخورد کرده است. طوفانهایی که گردبادها را به وجود آوردند با طوفانهای شدید دیگری احاطه میشوند، برخی با شرایط تقریباً یکسانی که هرگز چنین نشد. محققان آزمایشگاه لینکلن MIT که مجموعه دادهها با نام TorNet را سرپرستی کردند، اکنون آن را به صورت منبع باز منتشر کردهاند. آنها امیدوارند که بتوانند پیشرفتهایی را در شناسایی یکی از مرموزترین و خشنترین پدیدههای طبیعت یعنی کشف و تشخیص گردباد انجام دهند.
همراه با مجموعه داده جدید، تیم توسعه در حال انتشار مدلهایی است که بر روی آن آموزش انجام شده است. مدلها نویدبخش توانایی یادگیری ماشینی در تشخیص چرخش هستند. استفاده از این کار میتواند مرزهای جدیدی را برای پیشبینی باز کند و به آنها کمک کند تا هشدارهای دقیقتری ارائه دهند که ممکن است جان انسانها را نجات دهد.
عدم قطعیت چرخشی Swirling uncertainty
سالانه حدود 1200 گردباد در ایالات متحده رخ میدهد که میلیونها تا میلیاردها دلار خسارت مالی به بار میآورد و به طور میانگین جان 71 نفر را میگیرد. سال گذشته، یک گردباد غیرمعمول طولانی مدت در مسیری به طول 59 مایلی در می سی سی پی، 17 نفر را کشت و دست کم 165 نفر را مجروح کرد. با این حال، پیشبینی گردبادها بسیار دشوار است، زیرا دانشمندان تصویر روشنی از علت شکلگیری آنها ندارند در حالت کلی ما میتوانیم دو طوفان را ببینیم که یکسان به نظر میرسند، یکی باعث ایجاد گردباد میشود و دیگری ایجاد گردباد نمیکند. بنابراین این موضوع کار دانشمندان برای تشخیص گردباد را بسیار دشوار میکند.
اجزای اصلی گردباد طوفانهای تندری با ناپایداری ناشی از افزایش سریع هوای گرم و برش باد است که باعث چرخش میشود. رادار هواشناسی ابزار اصلی مورد استفاده برای نظارت بر این شرایط است. اما گردبادها حتی زمانی که نسبتاً نزدیک به رادار هستند، دارای ارتفاع بسیار پایین هستند و قابل شناسایی نیستند. همانطور که پرتو رادار با یک زاویه شیب معین از آنتن دورتر میشود، از سطح زمین بالاتر میرود و عمدتاً بازتابهای باران و تگرگ را میبیند که در “مزوسیکلون(mesocyclone)”، جریان بالا و چرخش طوفان گسترده است. و به یاد داشته باشید که مزوسیکلون همیشه گردباد تولید نمیکند.
با این دید محدود، پیشبینی کنندگان باید تصمیم بگیرند که آیا هشدار گردباد صادر کنند یا نه. آنها اغلب از جانب احتیاط اشتباه میکنند. در نتیجه، میزان اعلانهای اشتباه برای هشدارهای گردباد بیش از 70 درصد است. در سالهای اخیر، محققان برای شناسایی و پیشبینی بهتر گردبادها به یادگیری ماشین روی آوردهاند. با این حال، مجموعه دادهها و مدلهای خام همیشه برای جامعه گستردهتر قابل دسترسی نبوده و پیشرفت را در نطفه خفه میکنند. اما TorNet این شکاف را پر میکند. مجموعه داده شامل بیش از 200000 تصویر راداری است که 13587 مورد آن گردباد را به تصویر میکشد. بقیه تصاویر غیر گردباد هستند و از طوفانها در یکی از دو دسته گرفته شدهاند: طوفانهای شدید تصادفی انتخاب شده یا طوفانهای هشدار کاذب (آنهایی که پیشبینیکننده را وادار به صدور هشدار کردند اما گردباد ایجاد نکردند).
هر نمونه از یک طوفان یا گردباد شامل دو مجموعه از شش تصویر راداری است. این دو مجموعه با زوایای جابجایی رادار متفاوت مطابقت دارند. این شش تصویر، محصولات مختلف دادههای راداری، مانند بازتاب (نشان دادن شدت بارش) یا سرعت شعاعی (که نشان میدهد باد به سمت رادار یا دور از رادار حرکت میکند) را به تصویر میکشد. یک چالش در مدیریت مجموعه داده ابتدا پیدا کردن گردبادها بود. در مجموعه دادههای رادار آب و هوا، گردبادها رویدادهای بسیار نادری هستند. سپس تیم مجبور شد آن نمونههای گردباد را با نمونههای دشوار غیر گردبادی متعادل کند. اگر مجموعه داده بسیار آسان بود، مثلاً با مقایسه گردبادها با طوفانهای برفی، الگوریتمی که بر روی دادهها آموزش داده شده بود احتمالاً طوفانها را بیش از حد به عنوان گردباد طبقهبندی میکرد.
به دنبال پاسخها با یادگیری عمیق
با استفاده از مجموعه داده، محققان مدلهای هوش مصنوعی (AI) پایه را توسعه دادند. آنها به ویژه مشتاق به کار بردن یادگیری عمیق بودند، شکلی از یادگیری ماشینی که در پردازش دادههای بصری برتری دارد. یادگیری عمیق به تنهایی میتواند ویژگیها (مشاهدات کلیدی که یک الگوریتم از آنها برای تصمیمگیری استفاده میکند) را از تصاویر در یک مجموعه داده استخراج کند. سایر رویکردهای یادگیری ماشینی، انسان را ملزم میکند که ابتدا به صورت دستی ویژگیها را برچسبگذاری کند. نتایج استفاده از این تکنولوژی امیدوارکننده است. مدل یادگیری عمیق آنها مشابه یا بهتر از همه الگوریتمهای تشخیص گردباد شناخته شده عمل کرد. الگوریتم آموزش دیده به درستی 50 درصد از گردبادهای ضعیف تر EF-1 و بیش از 85 درصد از گردبادهای دارای رتبه EF-2 یا بالاتر را طبقهبندی کرد که مخربترین و پرهزینهترین رخدادهای این نوع طوفانها را تشکیل میدهند.
آنها همچنین دو نوع دیگر از مدلهای یادگیری ماشینی و یک مدل سنتی را برای مقایسه با آن ارزیابی کردند. کد منبع و پارامترهای همه این مدلها به صورت رایگان در دسترس هستند. مدلها و مجموعه دادهها همچنین در مقاله ارسال شده به مجله انجمن هواشناسی آمریکا (AMS) توضیح داده شده است. TorNet میتواند در علم هواشناسی برای استفادههای دیگر نیز مفید باشد، مانند انجام مطالعات موردی در مقیاس بزرگ در مورد طوفانها. همچنین میتوان آن را با سایر منابع داده، مانند تصاویر ماهوارهای یا نقشههای رعد و برق، تقویت کرد. ترکیب چندین نوع داده میتواند دقت مدلهای یادگیری ماشین را بهبود بخشد.