به خبرنامههای روزانه و هفتگی ما بپیوندید تا آ،ین بهروزرس،ها و محتوای انحصاری را در زمینه پوشش هوش مصنوعی پیشرو در صنعت ما دریافت کنید. او بیشتر یاد می گیرد
فن آوری قرن ها – قلم و کاغذ – در حال تجربه یک ارتقاء دیجیتال گسترده است. Google Research یک سیستم هوش مصنوعی ایجاد کرده است که میتواند تصاویر یادداشتهای دستنویس را با دقت به متن دیجیتالی قابل ویرایش تبدیل کند و به طور بالقوه روش میلیونها نفر را تغییر دهد و افکار خود را حفظ کند.
سیستم جدید، به نام InkSight، نشان دهنده یک پیشرفت بزرگ در تلاش های طول، مدت برای پر ، شکاف بین دست خط سنتی و متن دیجیتال است. به گفته محققان، در حالی که یادداشت برداری دیجیتال برای چندین دهه مزایای آشکاری را ارائه کرده است – قابلیت جستجو، ذخیره سازی ابری، سهولت ویرایش و ادغام با سایر ابزارهای دیجیتال – یادداشت برداری سنتی با قلم و کاغذ هنوز به طور گسترده ترجیح داده می شود.
چگونه سیستم هوش مصنوعی جدید گوگل دستخط انسان را بهتر از همیشه درک می کند
آندری م،ی، سرپرست پروژه در Google Research در این مقاله توضیح داد: «یادداشت برداری دیجیتال در حال افزایش محبوبیت است، زیرا روشی قوی، به راحتی قابل ویرایش و نمایهسازی برای ذخیره یادداشتها به صورت برداری ارائه میکند. با این حال، شکاف قابل توجهی بین این روش یادداشت برداری و یادداشت برداری سنتی با قلم و کاغذ وجود دارد، روشی که هنوز هم مورد علاقه ا،ریت قریب به اتفاق است.
چیزی که InkSight را انقلابی می کند رویکرد آن به درک دست خط است. تلاشهای قبلی برای تبدیل متن دستنویس به فرمت دیجیتال به شدت بر تجزیه و تحلیل ویژگیهای هندسی خطهای نوشتاری متکی بود – اساساً تلاش برای ردیابی خطوط روی صفحه. در عوض، InkSight قابلیت های پیشرفته هوش مصنوعی را ،یب می کند: توانایی خواندن و درک متن، و توانایی بازتولید طبیعی آن.
نتایج عالی هستند. در ارزیابیهای انس،، 87 درصد از نمونههای تولید شده توسط InkSight به ،وان اثری معتبر از متن وارد شده در نظر گرفته شد و 67 درصد از دستخط دیجیتالی تولید شده توسط انسان قابل تشخیص نبود. این سیستم میتواند سناریوهای دنیای واقعی را که ممکن است سیستمهای قبلی را سردرگم کند، مدیریت کند: نور ضعیف، پسزمینههای درهم و حتی متنی تا حدی مبهم.
محققان در مقاله خود که در arXiv منتشر شده است، توضیح میدهند: «طبق دانش ما، این اولین کاری است که به طور مؤثر متن دستنویس را در تصاویر تصادفی با ویژگیهای بصری و پسزمینههای متنوع بیش از حد نشان میدهد». این سیستم همچنین می تواند نقشه ها و نمودارهای ساده را با محدودیت هایی انجام دهد.
چرا دست خط هنوز در عصر دیجیتال ما مهم است و هوش مصنوعی چگونه می تواند به حفظ آن کمک کند
فناوری در حال رسیدن به لحظه ای حساس در تکامل تعامل انسان و رایانه است. با وجود چندین دهه پیشرفت دیجیتال، دست خط عمیقاً در شناخت و یادگیری انسان ریشه دارد. مطالعات به طور مداوم نشان داده اند که نوشتن با دست در مقایسه با تایپ ،، حفظ حافظه و درک مطلب را بهبود می بخشد. این یک چالش مداوم برای پذیرش فناوری در محیط های آموزشی و حرفه ای ایجاد کرده است.
مکسی میگوید: «هدف کار ما ایجاد یادداشتهای فیزیکی، بهویژه متون دستنویس، با جوهر دیجیتالی است که جزئیات مسیر دستنویس را در سطح خط ثبت میکند. این به یادداشتبرداران اجازه میدهد تا از مزایای رسانه دیجیتال بدون نیاز به استفاده از قلم بهره ببرند.
اثرات فراتر از راحتی ساده است. در محیطهای دانشگاهی، دانشآموزان میتوانند سبک دلخواه خود را در یادداشتبرداری دستنویس حفظ کنند و در عین حال توانایی جستجو، اشتراکگذاری و سازماندهی یادداشتهای خود را به صورت دیجیتالی به دست آورند. حرفهایهایی که ایدهها را ترسیم میکنند یا به صورت دستی یادداشتهای جلسات را میگیرند، میتوانند بهطور یکپارچه آنها را در جریان کار دیجیتال خود ادغام کنند. محققان و مورخان به راحتی می توانند اسناد دست نویس را دیجیتالی و تجزیه و تحلیل کنند.
شاید مهمتر از همه، InkSight میتواند به حفظ و دیجیتالی ، محتوای دستنویس در زبانهایی که بازنمایی دیجیتالی آنها از لحاظ تاریخی محدود بوده کمک کند. دکتر کلودیو موسات، یکی از محققان این پروژه میگوید: «کار ما میتواند امکان دسترسی به جوهر دیجیتالی زیرین یادداشتهای فیزیکی را فراهم کند، و به طور بالقوه امکان آموزش بهتر تشخیصدهندههای دستخط آنلاین برای زبانهایی با منابع تاریخی کم در جوهر دیجیتال را فراهم میکند. .
از هک تا برنامه دنیای واقعی: معماری فنی و آینده یادداشت برداری دیجیتال
معماری تکنولوژی بسیار ظریف است. InkSight که با استفاده از اجزای بسیار در دسترس، از جمله Vision Transformer (ViT) گوگل و مدل زبان mT5 ساخته شده است، نشان می دهد که چگونه می توان از طریق ،یب هوشمند ابزارهای موجود به جای ساخت همه چیز از ابتدا، به قابلیت های پیشرفته هوش مصنوعی دست یافت.
گوگل نسخه عمومی این مدل را با پادمان های اخلاقی مهم منتشر کرده است. این سیستم نمی تواند از ابتدا دست خط تولید کند، محدودیتی حیاتی که از سوء استفاده احتمالی برای جعل یا جعل هویت جلوگیری می کند.
محدودیت های فعلی وجود دارد. این سیستم به جای کل صفحات یکباره، متن را کلمه به کلمه پردازش می کند، و گاهی اوقات در رسیدگی به عرض های ، که بسیار گسترده یا تغییرات بزرگ در عرض استروک هستند، مشکل دارد. با این حال، این محدودیت ها در مقایسه با دستاوردهای رژیم جزئی به نظر می رسند.
این فناوری برای آزمایش عمومی از طریق نسخه ی نمایشی Hugging Face در دسترس است و به کاربران این امکان را می دهد تا نحوه ترجمه یادداشت های دست نوشته خود را به شکل دیجیتال تجربه کنند. بازخورد اولیه بسیار مثبت بوده است و کاربران به ویژه به توانایی سیستم در حفظ شخصیت شخصی دست خط و در عین حال ارائه مزایای دیجیتال اشاره ،د.
در حالی که بیشتر سیستم های هوش مصنوعی به دنبال خودکارسازی وظایف انسان هستند، InkSight روش متفاوتی را اتخاذ می کند. مزایای شناختی و صمیمیت شخصی دست خط را حفظ می کند و در عین حال قدرت ابزارهای دیجیتال را اضافه می کند. این تمایز ظریف اما حیاتی به آیندهای اشاره میکند که در آن فناوری به جای جایگزینی تواناییهای انسان، تقویت میشود.
در نهایت، بزرگترین نوآوری InkSight ممکن است خودکنترلی آن باشد که نشان میدهد چگونه هوش مصنوعی میتواند شیوههای انسان را بدون پاک ، آنچه در وهله اول انسان میسازد، پیش ببرد.
VB Daily
مطلع باشید! آ،ین اخبار را روزانه در صندوق ورودی خود دریافت کنید
با اشتراک، با شرایط خدمات VentureBeat موافقت می کنید.
با تشکر برای اشتراک. خبرنامه های بیشتر VB را اینجا ببینید.
خطایی رخ داد.
منبع: https://venturebeat.com/ai/googles-ai-system-could-change-the-way-we-write-inksight-turns-handwritten-notes-di،al/