به خبرنامههای روزانه و هفتگی ما بپیوندید تا آ،ین بهروزرس،ها و محتوای انحصاری را در زمینه پوشش هوش مصنوعی پیشرو در صنعت ما دریافت کنید. بیشتر بد،د
OpenAI با انتشار مجموعه داده های چند زبانه که عملکرد مدل های زبان را در ۱۴ زبان از جمله ،ی، آلم،، سواحیلی، بنگالی و یوروبا ارزیابی می کند، گام بزرگی در جهت گسترش دامنه جه، هوش مصنوعی برداشته است.
این شرکت مجموعه داده های Multi-Task Language Understanding (MMMLU) را در بستر داده باز Hugging Face به اشتراک گذاشت. این ارزیابی جدید بر اساس معیار محبوب درک زبان چند وظیفه ای (MMLU) است که دانش سیستم هوش مصنوعی را در 57 رشته از ریاضیات گرفته تا حقوق و علوم کامپیوتر، اما فقط به زبان ،یسی، آزمایش می کند.
OpenAI با گنجاندن انواع زبان ها در ارزیابی چند زبانه جدید، که برخی از آنها منابع محدودی برای داده های آموزشی هوش مصنوعی دارند، استاندارد جدیدی برای قابلیت های هوش مصنوعی چند زبانه تعیین کرده است. این استاندارد می تواند راه را برای دسترسی جه، عادلانه تر به فناوری باز کند. صنعت هوش مصنوعی به دلیل ناتو، خود در توسعه مدل های زب، که بتواند زبان های میلیون ها نفر در سراسر جهان را درک کند، با انتقاد مواجه شده است.
OpenAI یک استاندارد جه، برای ارزیابی هوش مصنوعی چند زبانه ارائه می دهد
مجموعه دادههای MMMLU مدلهای هوش مصنوعی را به چالش میکشد تا در محیطهای زب، متنوع کار کنند، که منع،کننده نیاز روزافزون به سیستمهای هوش مصنوعی است که میتوانند با کاربران در سراسر جهان درگیر شوند. همانطور که شرکتها و ،تها راهحلهای مبتنی بر هوش مصنوعی را به طور فزایندهای اتخاذ میکنند، تقاضا برای مدلهایی که میتوانند متن را به زبانهای مختلف درک و تولید کنند، فوریتر میشود.
تا همین اوا،، تحقیقات هوش مصنوعی عمدتاً بر ،یسی و چند زبان رایج متمرکز بود و بسیاری از زبانهای کم منابع را پشت سر گذاشت. تصمیم OpenAI برای گنجاندن زبانهایی مانند سواحیلی و یوروبا که میلیونها نفر به آنها صحبت میکنند اما اغلب در تحقیقات هوش مصنوعی نادیده گرفته میشوند، نشاندهنده تغییر به سمت فناوری هوش مصنوعی فراگیرتر است. این حرکت بهویژه برای شرکتهایی که بهدنبال استقرار راهحلهای هوش مصنوعی در بازارهای نوظهور هستند، مهم است، جایی که موانع زب، بهطور سنتی چالشهای مهمی را ایجاد میکنند.
ترجمه انس، سطح دقت هوش مصنوعی چند زبانه را بالا می برد
OpenAI از مترجمان انس، حرفهای برای ایجاد مجموعه دادههای MMMLU استفاده کرد و از دقت بالاتری نسبت به مجموعه دادههای مشابهی که به ترجمه ماشینی متکی هستند، اطمینان حاصل کرد. ابزارهای ترجمه ماشینی اغلب خطاهای ظریفی را معرفی می کنند، به خصوص در زبان هایی که منابع کمتری برای آموزش دارند. با استفاده از تخصص انس،، OpenAI تضمین میکند که مجموعه داده پایه قابل اعتمادتری برای ارزیابی مدلهای هوش مصنوعی در چندین زبان فراهم میکند.
این تصمیم برای صنایعی که دقت آنها قابل به خطر افتادن نیست بسیار مهم است. در بخش هایی مانند مراقبت های بهداشتی، حقوقی و مالی، حتی اشتباهات جزئی در ترجمه می تواند عواقب جدی داشته باشد. تمرکز OpenAI بر کیفیت ترجمه، مجموعه دادههای MMMLU را به ،وان ابزاری حیاتی برای سازمانهایی که به سیستمهای هوش مصنوعی نیاز دارند تا در مرزهای زب، و فرهنگی به طور قابل اعتماد عمل کنند، قرار میدهد.
مشارکت Hugging Face دسترسی باز به داده های هوش مصنوعی چندزبانه را ارتقا می دهد
OpenAI با انتشار مجموعه داده های MMMLU در Hugging Face، یک پلتفرم محبوب برای به اشتراک گذاری مدل ها و مجموعه داده های یادگیری ماشین، جامعه تحقیقاتی گسترده تر هوش مصنوعی را درگیر می کند. Hugging Face به مقصدی برای ابزارهای AI منبع باز تبدیل شده است و افزودن مجموعه داده های MMMLU نشان دهنده تعهد OpenAI به ترویج دسترسی باز در تحقیقات هوش مصنوعی است.
با این حال، این نسخه در زم، ارائه می شود که OpenAI با بررسی های فزاینده ای در مورد رویکرد خود به باز بودن مواجه شده است. انتقادها در ماههای اخیر بهویژه از سوی ایلان ماسک، یکی از بنیانگذاران، افزایش یافته است، که این شرکت را به انحراف از مأموریت اصلی خود به ،وان یک نهاد غیرانتفاعی و منبع باز متهم کرد. شکایت ماسک که اوایل سال جاری ارائه کرد، ادعا میکند که تغییر OpenAI به سمت فعالیتهای انتفاعی – بهویژه مشارکت آن با مایکروسافت – با اصول تاسیس شرکت در تضاد است.
با وجود این، OpenAI از استراتژی فعلی خود دفاع کرده و استدلال می کند که به جای منبع باز، «دسترسی باز» را در اولویت قرار می دهد. در این زمینه، OpenAI قصد دارد دسترسی گسترده به فناوریهای خود را بدون به اشتراک گذاشتن جزئیات داخلی مدلهای پیشرفتهتر خود فراهم کند. انتشار مجموعه دادههای MMMLU در این فلسفه قرار میگیرد و به جامعه تحقیقاتی ابزار قدرتمندی را ارائه میکند و در عین حال کنترل مدلهای اختصاصی خود را حفظ میکند.
OpenAI Academy: گسترش دسترسی به هوش مصنوعی در بازارهای نوظهور
علاوه بر انتشار مجموعه داده های MMMLU، OpenAI با راه اندازی آکادمی OpenAI تعهد خود را به دسترسی جه، هوش مصنوعی تقویت می کند. آکادمی که در همان روز با مجموعه داده های MMMLU اعلام شد، برای سرمایه گذاری در توسعه دهندگان و سازمان های هدفمند طراحی شده است که از هوش مصنوعی برای رسیدگی به مسائل مهم در جوامع خود، به ویژه در کشورهای با درآمد کم و متوسط استفاده می کنند.
این آکادمی آموزش، راهنمایی فنی و 1 میلیون دلار اعتبار API را برای اطمینان از دسترسی استعدادهای هوش مصنوعی محلی به منابع پیشرفته ارائه خواهد کرد. OpenAI امیدوار است با حمایت از توسعه دهندگ، که چالش های اجتماعی و اقتصادی منحصر به فرد پیش روی مناطق خود را درک می کنند، جوامع را برای ساخت برنامه های کاربردی هوش مصنوعی متن، با نیازهای محلی توانمند کند.
این ابتکار با تأکید بر هدف OpenAI برای ارائه ابزارهای پیشرفته هوش مصنوعی و آموزش به جوامع مختلف جه،، مجموعه داده های MMMLU را تکمیل می کند. هم مجموعه دادههای MMMLU و هم آکادمی منع،کننده استراتژی بلندمدت OpenAI برای اطمینان از اینکه همه بشریت از توسعه هوش مصنوعی بهرهمند میشوند، بهویژه جوامعی که بهطور سنتی از آ،ین پیشرفتهای هوش مصنوعی برخوردار نبودهاند، منع، میکنند.
هوش مصنوعی چند زبانه به شرکت ها مزیت رقابتی می دهد
برای شرکتها، مجموعه دادههای MMMLU فرصتی برای ارزیابی سیستمهای هوش مصنوعی خود در یک زمینه جه، فراهم میکند. همانطور که شرکت ها در بازارهای بین المللی گسترش می یابند، توانایی استقرار راه حل های هوش مصنوعی که چندین زبان را درک می کنند بسیار مهم می شود. خواه خدمات مشتری، تعدیل محتوا، یا تجزیه و تحلیل داده ها باشد، سیستم های هوش مصنوعی که به خوبی در زبان ها کار می کنند می توانند با کاهش اصطکاک در ارتباطات و بهبود تجربه کاربر، مزیت رقابتی ایجاد کنند.
تمرکز مجموعه داده بر موضوعات حرفه ای و آکادمیک لایه دیگری از ارزش را برای شرکت ها می افزاید. شرکتهایی که در زمینه حقوق، آموزش و پژوهش کار میکنند میتوانند از مجموعه دادههای MMMLU برای آزمایش عملکرد مدلهای هوش مصنوعی خود در زمینههای تخصصی استفاده کنند و اطمینان حاصل کنند که سیستمهایشان استانداردهای بالای مورد نیاز برای این بخشها را برآورده میکنند. همانطور که هوش مصنوعی به تکامل خود ادامه می دهد، توانایی انجام وظایف پیچیده و خاص دامنه در چندین زبان به یک تمایز کلیدی برای شرکت هایی تبدیل خواهد شد که در صحنه جه، رقابت می کنند.
آینده ای چند زبانه: مجموعه داده های MMMLU برای هوش مصنوعی چه م،ایی دارد
انتشار مجموعه داده MMMLU احتمالاً تأثیرات ماندگاری بر صنعت هوش مصنوعی خواهد داشت. همانطور که شرکت ها و محققان بیشتری شروع به آزمایش مدل های خود بر روی این استاندارد چند زبانه می کنند، تقاضا برای سیستم های هوش مصنوعی که می توانند به طور یکپارچه در بین زبان ها کار کنند افزایش می یابد. این میتواند منجر به نوآوریهای جدید در پردازش زبان و همچنین افزایش پذیرش راهحلهای هوش مصنوعی در بخشهایی از جهان شود که بهطور سنتی از فناوری استفاده نمیکنند.
برای OpenAI، مجموعه داده MMMLU هم یک چالش و هم یک فرصت را نشان می دهد. از یک طرف، این شرکت خود را به ،وان یک پیشرو در هوش مصنوعی چند زبانه قرار می دهد و ابزارهایی را ارائه می دهد که شکاف حیاتی در چشم انداز فعلی هوش مصنوعی را برطرف می کند. از سوی دیگر، موضع در حال تحول OpenAI در مورد باز بودن همچنان مورد بررسی دقیق قرار خواهد گرفت زیرا با تنش های بین منافع عمومی و منافع خصوصی دست و پنجه نرم می کند.
همانطور که هوش مصنوعی به طور فزاینده ای در اقتصاد جه، ادغام می شود، شرکت ها و ،ت ها به طور ی،ان باید با پیامدهای اخلاقی و عملی این فناوری ها دست و پنجه نرم کنند. انتشار مجموعه دادههای MMMLU توسط OpenAI گامی در مسیر درست است، اما همچنین سؤالات مهمی در مورد اینکه چه مقدار از انقلاب هوش مصنوعی برای همه باز خواهد بود را ایجاد میکند.
معاون روزانه
مطلع باشید! آ،ین اخبار را روزانه در صندوق ورودی خود دریافت کنید
با اشتراک، با شرایط خدمات VentureBeat موافقت می کنید.
با تشکر از شما برای اشتراک. می تو،د خبرنامه های VB بیشتری را در اینجا بیابید.
خطایی رخ داد.
منبع: https://venturebeat.com/ai/openai-tackles-global-language-divide-with-m،ive-multilingual-ai-dataset-release/