سیستم هوش مصنوعی گوگل می تواند نحوه نوشتن ما را تغییر دهد: InkSight یادداشت های دست نویس را به دیجیتال تبدیل می کند

سیستم هوش مصنوعی گوگل می تواند نحوه نوشتن ما را تغییر دهد: InkSight یادداشت های دست نویس را به دیجیتال تبدیل می کند

به خبرنامه‌های روزانه و هفتگی ما بپیوندید تا آ،ین به‌روزرس،‌ها و محتوای انحصاری را در زمینه پوشش هوش مصنوعی پیشرو در صنعت ما دریافت کنید. او بیشتر یاد می گیرد


فن آوری قرن ها – قلم و کاغذ – در حال تجربه یک ارتقاء دیجیتال گسترده است. Google Research یک سیستم هوش مصنوعی ایجاد کرده است که می‌تواند تصاویر یادداشت‌های دست‌نویس را با دقت به متن دیجیتالی قابل ویرایش تبدیل کند و به طور بالقوه روش میلیون‌ها نفر را تغییر دهد و افکار خود را حفظ کند.

سیستم جدید، به نام InkSight، نشان دهنده یک پیشرفت بزرگ در تلاش های طول، مدت برای پر ، شکاف بین دست خط سنتی و متن دیجیتال است. به گفته محققان، در حالی که یادداشت برداری دیجیتال برای چندین دهه مزایای آشکاری را ارائه کرده است – قابلیت جستجو، ذخیره سازی ابری، سهولت ویرایش و ادغام با سایر ابزارهای دیجیتال – یادداشت برداری سنتی با قلم و کاغذ هنوز به طور گسترده ترجیح داده می شود.

صفحه‌ای از «آلیس در سرزمین عجایب» که به شکل اصلی خود (سمت چپ) و پس از دیجیتالی‌سازی توسط هوش مصنوعی InkSight Google (سمت راست) نشان داده شده است، که توانایی سیستم را در حفظ طبیعی بودن متن دست‌نویس در حین دیجیتالی ، آن نشان می‌دهد. (اعتبار: گوگل)

چگونه سیستم هوش مصنوعی جدید گوگل دستخط انسان را بهتر از همیشه درک می کند

آندری م،ی، سرپرست پروژه در Google Research در این مقاله توضیح داد: «یادداشت برداری دیجیتال در حال افزایش محبوبیت است، زیرا روشی قوی، به راحتی قابل ویرایش و نمایه‌سازی برای ذخیره یادداشت‌ها به صورت برداری ارائه می‌کند. با این حال، شکاف قابل توجهی بین این روش یادداشت برداری و یادداشت برداری سنتی با قلم و کاغذ وجود دارد، روشی که هنوز هم مورد علاقه ا،ریت قریب به اتفاق است.

چیزی که InkSight را انقلابی می کند رویکرد آن به درک دست خط است. تلاش‌های قبلی برای تبدیل متن دست‌نویس به فرمت دیجیتال به شدت بر تجزیه و تحلیل ویژگی‌های هندسی خط‌های نوشتاری متکی بود – اساساً تلاش برای ردیابی خطوط روی صفحه. در عوض، InkSight قابلیت های پیشرفته هوش مصنوعی را ،یب می کند: توانایی خواندن و درک متن، و توانایی بازتولید طبیعی آن.

نتایج عالی هستند. در ارزیابی‌های انس،، 87 درصد از نمونه‌های تولید شده توسط InkSight به ،وان اثری معتبر از متن وارد شده در نظر گرفته شد و 67 درصد از دست‌خط دیجیتالی تولید شده توسط انسان قابل تشخیص نبود. این سیستم می‌تواند سناریوهای دنیای واقعی را که ممکن است سیستم‌های قبلی را سردرگم کند، مدیریت کند: نور ضعیف، پس‌زمینه‌های درهم و حتی متنی تا حدی مبهم.

محققان در مقاله خود که در arXiv منتشر شده است، توضیح می‌دهند: «طبق دانش ما، این اولین کاری است که به طور مؤثر متن دست‌نویس را در تصاویر تصادفی با ویژگی‌های بصری و پس‌زمینه‌های متنوع بیش از حد نشان می‌دهد». این سیستم همچنین می تواند نقشه ها و نمودارهای ساده را با محدودیت هایی انجام دهد.

همان پیام چندزبانه کریسمس در سه مرحله ظاهر می شود: دست خط اصلی (سمت چپ)، تجزیه و تحلیل سطح کلمه InkSight با پردازش رنگی (وسط)، و نسخه دیجیتال نهایی با حروف نویسه های ذخیره شده (راست). این سیستم سبک دست خط شخصی را در خطوط چینی، ،یسی و فرانسوی حفظ می کند. (اعتبار: گوگل)

چرا دست خط هنوز در عصر دیجیتال ما مهم است و هوش مصنوعی چگونه می تواند به حفظ آن کمک کند

فناوری در حال رسیدن به لحظه ای حساس در تکامل تعامل انسان و رایانه است. با وجود چندین دهه پیشرفت دیجیتال، دست خط عمیقاً در شناخت و یادگیری انسان ریشه دارد. مطالعات به طور مداوم نشان داده اند که نوشتن با دست در مقایسه با تایپ ،، حفظ حافظه و درک مطلب را بهبود می بخشد. این یک چالش مداوم برای پذیرش فناوری در محیط های آموزشی و حرفه ای ایجاد کرده است.

مک‌سی می‌گوید: «هدف کار ما ایجاد یادداشت‌های فیزیکی، به‌ویژه متون دست‌نویس، با جوهر دیجیتالی است که جزئیات مسیر دست‌نویس را در سطح خط ثبت می‌کند. این به یادداشت‌برداران اجازه می‌دهد تا از مزایای رسانه دیجیتال بدون نیاز به استفاده از قلم بهره ببرند.

اثرات فراتر از راحتی ساده است. در محیط‌های دانشگاهی، دانش‌آموزان می‌توانند سبک دلخواه خود را در یادداشت‌برداری دست‌نویس حفظ کنند و در عین حال توانایی جستجو، اشتراک‌گذاری و سازمان‌دهی یادداشت‌های خود را به صورت دیجیتالی به دست آورند. حرفه‌ای‌هایی که ایده‌ها را ترسیم می‌کنند یا به صورت دستی یادداشت‌های جلسات را می‌گیرند، می‌توانند به‌طور یکپارچه آنها را در جریان کار دیجیتال خود ادغام کنند. محققان و مورخان به راحتی می توانند اسناد دست نویس را دیجیتالی و تجزیه و تحلیل کنند.

شاید مهم‌تر از همه، InkSight می‌تواند به حفظ و دیجیتالی ، محتوای دست‌نویس در زبان‌هایی که بازنمایی دیجیتالی آنها از لحاظ تاریخی محدود بوده کمک کند. دکتر کلودیو موسات، یکی از محققان این پروژه می‌گوید: «کار ما می‌تواند امکان دسترسی به جوهر دیجیتالی زیرین یادداشت‌های فیزیکی را فراهم کند، و به طور بالقوه امکان آموزش بهتر تشخیص‌دهنده‌های دستخط آنلاین برای زبان‌هایی با منابع تاریخی کم در جوهر دیجیتال را فراهم می‌کند. .

از هک تا برنامه دنیای واقعی: معماری فنی و آینده یادداشت برداری دیجیتال

معماری تکنولوژی بسیار ظریف است. InkSight که با استفاده از اجزای بسیار در دسترس، از جمله Vision Transformer (ViT) گوگل و مدل زبان mT5 ساخته شده است، نشان می دهد که چگونه می توان از طریق ،یب هوشمند ابزارهای موجود به جای ساخت همه چیز از ابتدا، به قابلیت های پیشرفته هوش مصنوعی دست یافت.

گوگل نسخه عمومی این مدل را با پادمان های اخلاقی مهم منتشر کرده است. این سیستم نمی تواند از ابتدا دست خط تولید کند، محدودیتی حیاتی که از سوء استفاده احتمالی برای جعل یا جعل هویت جلوگیری می کند.

محدودیت های فعلی وجود دارد. این سیستم به جای کل صفحات یکباره، متن را کلمه به کلمه پردازش می کند، و گاهی اوقات در رسیدگی به عرض های ، که بسیار گسترده یا تغییرات بزرگ در عرض استروک هستند، مشکل دارد. با این حال، این محدودیت ها در مقایسه با دستاوردهای رژیم جزئی به نظر می رسند.

این فناوری برای آزمایش عمومی از طریق نسخه ی نمایشی Hugging Face در دسترس است و به کاربران این امکان را می دهد تا نحوه ترجمه یادداشت های دست نوشته خود را به شکل دیجیتال تجربه کنند. بازخورد اولیه بسیار مثبت بوده است و کاربران به ویژه به توانایی سیستم در حفظ شخصیت شخصی دست خط و در عین حال ارائه مزایای دیجیتال اشاره ،د.

در حالی که بیشتر سیستم های هوش مصنوعی به دنبال خودکارسازی وظایف انسان هستند، InkSight روش متفاوتی را اتخاذ می کند. مزایای شناختی و صمیمیت شخصی دست خط را حفظ می کند و در عین حال قدرت ابزارهای دیجیتال را اضافه می کند. این تمایز ظریف اما حیاتی به آینده‌ای اشاره می‌کند که در آن فناوری به جای جایگزینی توانایی‌های انسان، تقویت می‌شود.

در نهایت، بزرگ‌ترین نوآوری InkSight ممکن است خودکنترلی آن باشد که نشان می‌دهد چگونه هوش مصنوعی می‌تواند شیوه‌های انسان را بدون پاک ، آنچه در وهله اول انسان می‌سازد، پیش ببرد.

VB Daily

مطلع باشید! آ،ین اخبار را روزانه در صندوق ورودی خود دریافت کنید

با اشتراک، با شرایط خدمات VentureBeat موافقت می کنید.

با تشکر برای اشتراک. خبرنامه های بیشتر VB را اینجا ببینید.

خطایی رخ داد.


منبع: https://venturebeat.com/ai/googles-ai-system-could-change-the-way-we-write-inksight-turns-handwritten-notes-di،al/