Инструменты транскрипции текста не являются чем-то новым, но Facebook сталкивается с различными проблемами из-за размера своей платформы и множества изображений, которые она видит. Розетта извлекает текст из 1 миллиарда изображений и видеокадров в день как на Facebook, так и на Instagram.
В настоящее время не совсем ясно, что делает Facebook с данными. Это полезно для базовых функций, таких как поиск фотографий и программ. Но также звучит так, что Facebook начинает ставить нейросеть на гораздо более крупные цели, например, выяснять, что было бы интересно разместить в вашей ленте новостей, и, что еще более важно, выяснить, какие мемы – просто дурацкие мемы и которые на самом деле распространяют разжигание ненависти или другие оскорбительные комментарии.
Facebook говорит, что извлечение текста и машинное обучение используются для “автоматического определения контента, который нарушает нашу политику в отношении ненависти” и что это делается на нескольких языках. Учитывая известные проблемы модерации, хорошо работающая система, которая может автоматически помечать потенциально проблематичные изображения, может оказаться реальной помощью.