OpenAI با انتشار یک مجموعه داده عظیم چندزبانه هوش مصنوعی، شکاف جهانی زبان را برطرف می کند

OpenAI با انتشار یک مجموعه داده عظیم چندزبانه هوش مصنوعی، شکاف جهانی زبان را برطرف می کند

به خبرنامه‌های روزانه و هفتگی ما بپیوندید تا آ،ین به‌روزرس،‌ها و محتوای انحصاری را در زمینه پوشش هوش مصنوعی پیشرو در صنعت ما دریافت کنید. بیشتر بد،د


OpenAI با انتشار مجموعه داده های چند زبانه که عملکرد مدل های زبان را در ۱۴ زبان از جمله ،ی، آلم،، سواحیلی، بنگالی و یوروبا ارزیابی می کند، گام بزرگی در جهت گسترش دامنه جه، هوش مصنوعی برداشته است.

این شرکت مجموعه داده های Multi-Task Language Understanding (MMMLU) را در بستر داده باز Hugging Face به اشتراک گذاشت. این ارزیابی جدید بر اساس معیار محبوب درک زبان چند وظیفه ای (MMLU) است که دانش سیستم هوش مصنوعی را در 57 رشته از ریاضیات گرفته تا حقوق و علوم کامپیوتر، اما فقط به زبان ،یسی، آزمایش می کند.

OpenAI با گنجاندن انواع زبان ها در ارزیابی چند زبانه جدید، که برخی از آنها منابع محدودی برای داده های آموزشی هوش مصنوعی دارند، استاندارد جدیدی برای قابلیت های هوش مصنوعی چند زبانه تعیین کرده است. این استاندارد می تواند راه را برای دسترسی جه، عادلانه تر به فناوری باز کند. صنعت هوش مصنوعی به دلیل ناتو، خود در توسعه مدل های زب، که بتواند زبان های میلیون ها نفر در سراسر جهان را درک کند، با انتقاد مواجه شده است.

OpenAI یک استاندارد جه، برای ارزیابی هوش مصنوعی چند زبانه ارائه می دهد

مجموعه داده‌های MMMLU مدل‌های هوش مصنوعی را به چالش می‌کشد تا در محیط‌های زب، متنوع کار کنند، که منع،‌کننده نیاز روزافزون به سیستم‌های هوش مصنوعی است که می‌توانند با کاربران در سراسر جهان درگیر شوند. همانطور که شرکت‌ها و ،ت‌ها راه‌حل‌های مبتنی بر هوش مصنوعی را به طور فزاینده‌ای اتخاذ می‌کنند، تقاضا برای مدل‌هایی که می‌توانند متن را به زبان‌های مختلف درک و تولید کنند، فوری‌تر می‌شود.

تا همین اوا،، تحقیقات هوش مصنوعی عمدتاً بر ،یسی و چند زبان رایج متمرکز بود و بسیاری از زبان‌های کم منابع را پشت سر گذاشت. تصمیم OpenAI برای گنجاندن زبان‌هایی مانند سواحیلی و یوروبا که میلیون‌ها نفر به آنها صحبت می‌کنند اما اغلب در تحقیقات هوش مصنوعی نادیده گرفته می‌شوند، نشان‌دهنده تغییر به سمت فناوری هوش مصنوعی فراگیرتر است. این حرکت به‌ویژه برای شرکت‌هایی که به‌دنبال استقرار راه‌حل‌های هوش مصنوعی در بازارهای نوظهور هستند، مهم است، جایی که موانع زب، به‌طور سنتی چالش‌های مهمی را ایجاد می‌کنند.

ترجمه انس، سطح دقت هوش مصنوعی چند زبانه را بالا می برد

OpenAI از مترجمان انس، حرفه‌ای برای ایجاد مجموعه داده‌های MMMLU استفاده کرد و از دقت بالاتری نسبت به مجموعه داده‌های مشابهی که به ترجمه ماشینی متکی هستند، اطمینان حاصل کرد. ابزارهای ترجمه ماشینی اغلب خطاهای ظریفی را معرفی می کنند، به خصوص در زبان هایی که منابع کمتری برای آموزش دارند. با استفاده از تخصص انس،، OpenAI تضمین می‌کند که مجموعه داده پایه قابل اعتمادتری برای ارزیابی مدل‌های هوش مصنوعی در چندین زبان فراهم می‌کند.

این تصمیم برای صنایعی که دقت آنها قابل به خطر افتادن نیست بسیار مهم است. در بخش هایی مانند مراقبت های بهداشتی، حقوقی و مالی، حتی اشتباهات جزئی در ترجمه می تواند عواقب جدی داشته باشد. تمرکز OpenAI بر کیفیت ترجمه، مجموعه داده‌های MMMLU را به ،وان ابزاری حیاتی برای سازمان‌هایی که به سیستم‌های هوش مصنوعی نیاز دارند تا در مرزهای زب، و فرهنگی به طور قابل اعتماد عمل کنند، قرار می‌دهد.

مشارکت Hugging Face دسترسی باز به داده های هوش مصنوعی چندزبانه را ارتقا می دهد

OpenAI با انتشار مجموعه داده های MMMLU در Hugging Face، یک پلتفرم محبوب برای به اشتراک گذاری مدل ها و مجموعه داده های یادگیری ماشین، جامعه تحقیقاتی گسترده تر هوش مصنوعی را درگیر می کند. Hugging Face به مقصدی برای ابزارهای AI منبع باز تبدیل شده است و افزودن مجموعه داده های MMMLU نشان دهنده تعهد OpenAI به ترویج دسترسی باز در تحقیقات هوش مصنوعی است.

با این حال، این نسخه در زم، ارائه می شود که OpenAI با بررسی های فزاینده ای در مورد رویکرد خود به باز بودن مواجه شده است. انتقادها در ماه‌های اخیر به‌ویژه از سوی ایلان ماسک، یکی از بنیان‌گذاران، افزایش یافته است، که این شرکت را به انحراف از مأموریت اصلی خود به ،وان یک نهاد غیرانتفاعی و منبع باز متهم کرد. شکایت ماسک که اوایل سال جاری ارائه کرد، ادعا می‌کند که تغییر OpenAI به سمت فعالیت‌های انتفاعی – به‌ویژه مشارکت آن با مایکروسافت – با اصول تاسیس شرکت در تضاد است.

با وجود این، OpenAI از استراتژی فعلی خود دفاع کرده و استدلال می کند که به جای منبع باز، «دسترسی باز» را در اولویت قرار می دهد. در این زمینه، OpenAI قصد دارد دسترسی گسترده به فناوری‌های خود را بدون به اشتراک گذاشتن جزئیات داخلی مدل‌های پیشرفته‌تر خود فراهم کند. انتشار مجموعه داده‌های MMMLU در این فلسفه قرار می‌گیرد و به جامعه تحقیقاتی ابزار قدرتمندی را ارائه می‌کند و در عین حال کنترل مدل‌های اختصاصی خود را حفظ می‌کند.

OpenAI Academy: گسترش دسترسی به هوش مصنوعی در بازارهای نوظهور

علاوه بر انتشار مجموعه داده های MMMLU، OpenAI با راه اندازی آکادمی OpenAI تعهد خود را به دسترسی جه، هوش مصنوعی تقویت می کند. آکادمی که در همان روز با مجموعه داده های MMMLU اعلام شد، برای سرمایه گذاری در توسعه دهندگان و سازمان های هدفمند طراحی شده است که از هوش مصنوعی برای رسیدگی به مسائل مهم در جوامع خود، به ویژه در کشورهای با درآمد کم و متوسط ​​استفاده می کنند.

این آکادمی آموزش، راهنمایی فنی و 1 میلیون دلار اعتبار API را برای اطمینان از دسترسی استعدادهای هوش مصنوعی محلی به منابع پیشرفته ارائه خواهد کرد. OpenAI امیدوار است با حمایت از توسعه دهندگ، که چالش های اجتماعی و اقتصادی منحصر به فرد پیش روی مناطق خود را درک می کنند، جوامع را برای ساخت برنامه های کاربردی هوش مصنوعی متن، با نیازهای محلی توانمند کند.

این ابتکار با تأکید بر هدف OpenAI برای ارائه ابزارهای پیشرفته هوش مصنوعی و آموزش به جوامع مختلف جه،، مجموعه داده های MMMLU را تکمیل می کند. هم مجموعه داده‌های MMMLU و هم آکادمی منع،‌کننده استراتژی بلندمدت OpenAI برای اطمینان از اینکه همه بشریت از توسعه هوش مصنوعی بهره‌مند می‌شوند، به‌ویژه جوامعی که به‌طور سنتی از آ،ین پیشرفت‌های هوش مصنوعی برخوردار نبوده‌اند، منع، می‌کنند.

هوش مصنوعی چند زبانه به شرکت ها مزیت رقابتی می دهد

برای شرکت‌ها، مجموعه داده‌های MMMLU فرصتی برای ارزیابی سیستم‌های هوش مصنوعی خود در یک زمینه جه، فراهم می‌کند. همانطور که شرکت ها در بازارهای بین المللی گسترش می یابند، توانایی استقرار راه حل های هوش مصنوعی که چندین زبان را درک می کنند بسیار مهم می شود. خواه خدمات مشتری، تعدیل محتوا، یا تجزیه و تحلیل داده ها باشد، سیستم های هوش مصنوعی که به خوبی در زبان ها کار می کنند می توانند با کاهش اصطکاک در ارتباطات و بهبود تجربه کاربر، مزیت رقابتی ایجاد کنند.

تمرکز مجموعه داده بر موضوعات حرفه ای و آکادمیک لایه دیگری از ارزش را برای شرکت ها می افزاید. شرکت‌هایی که در زمینه حقوق، آموزش و پژوهش کار می‌کنند می‌توانند از مجموعه داده‌های MMMLU برای آزمایش عملکرد مدل‌های هوش مصنوعی خود در زمینه‌های تخصصی استفاده کنند و اطمینان حاصل کنند که سیستم‌هایشان استانداردهای بالای مورد نیاز برای این بخش‌ها را برآورده می‌کنند. همانطور که هوش مصنوعی به تکامل خود ادامه می دهد، توانایی انجام وظایف پیچیده و خاص دامنه در چندین زبان به یک تمایز کلیدی برای شرکت هایی تبدیل خواهد شد که در صحنه جه، رقابت می کنند.

آینده ای چند زبانه: مجموعه داده های MMMLU برای هوش مصنوعی چه م،ایی دارد

انتشار مجموعه داده MMMLU احتمالاً تأثیرات ماندگاری بر صنعت هوش مصنوعی خواهد داشت. همانطور که شرکت ها و محققان بیشتری شروع به آزمایش مدل های خود بر روی این استاندارد چند زبانه می کنند، تقاضا برای سیستم های هوش مصنوعی که می توانند به طور یکپارچه در بین زبان ها کار کنند افزایش می یابد. این می‌تواند منجر به نوآوری‌های جدید در پردازش زبان و همچنین افزایش پذیرش راه‌حل‌های هوش مصنوعی در بخش‌هایی از جهان شود که به‌طور سنتی از فناوری استفاده نمی‌کنند.

برای OpenAI، مجموعه داده MMMLU هم یک چالش و هم یک فرصت را نشان می دهد. از یک طرف، این شرکت خود را به ،وان یک پیشرو در هوش مصنوعی چند زبانه قرار می دهد و ابزارهایی را ارائه می دهد که شکاف حیاتی در چشم انداز فعلی هوش مصنوعی را برطرف می کند. از سوی دیگر، موضع در حال تحول OpenAI در مورد باز بودن همچنان مورد بررسی دقیق قرار خواهد گرفت زیرا با تنش های بین منافع عمومی و منافع خصوصی دست و پنجه نرم می کند.

همانطور که هوش مصنوعی به طور فزاینده ای در اقتصاد جه، ادغام می شود، شرکت ها و ،ت ها به طور ی،ان باید با پیامدهای اخلاقی و عملی این فناوری ها دست و پنجه نرم کنند. انتشار مجموعه داده‌های MMMLU توسط OpenAI گامی در مسیر درست است، اما همچنین سؤالات مهمی در مورد اینکه چه مقدار از انقلاب هوش مصنوعی برای همه باز خواهد بود را ایجاد می‌کند.

معاون روزانه

مطلع باشید! آ،ین اخبار را روزانه در صندوق ورودی خود دریافت کنید

با اشتراک، با شرایط خدمات VentureBeat موافقت می کنید.

با تشکر از شما برای اشتراک. می تو،د خبرنامه های VB بیشتری را در اینجا بیابید.

خطایی رخ داد.


منبع: https://venturebeat.com/ai/openai-tackles-global-language-divide-with-m،ive-multilingual-ai-dataset-release/