Фото: Twitter
Короткий текст - джерело інформації, яку людина навіть не збиралася розкривати
Вчені з РФ створили нейромережу, яка за змістом і оформленням постів у соціальних мережах може відрізняти грамотних людей від тих, хто погано вчився в школі. Відмінники вставляють іноземні слова, а двієчники - смайли.
Російські вчені представили алгоритм, що вміє аналізувати повідомлення в соцмережах і визначати, хто їх написав - відмінник або двієчник. Фахівці стверджують, що точність становить 94%, пише
EPJ Data Science.
Дослідники надали для вивчення нейромережі пости в Twitter і Вконтакте.
"Наша модель з точністю до 94% виявляла учнів з високою і низькою успішністю... Такий підхід може бути корисний і для виявлення депресії, впливає на навчальні досягнення", - заявив автор роботи, завідувач лабораторією обчислювальних соціальних наук Інституту освіти НДУ ВШЕ Іван Смирнов.
Вчений та його колеги зібрали і вивчили повідомлення, які на своїх сторінках у ВКонтакті написали, приблизно, 2,4 тисячі підлітків, що проходили в 2012 році спеціальний тест на оцінку грамотності та здатності застосовувати знання на практиці.
Матеріал був наданий для тренування нейромереж, які проаналізували смисловий зміст і стилістику повідомлень і зіставили їх з типовим рівнем освіти та успішності людей, для яких характерні подібні інтереси, знання і стиль написання.
В результаті, нейромережа навчилася досить точно визначати двієчників і відмінників.
Відзначається, що відмінникам характерні довгі тексти, пов'язані з літературою, фізикою і описом розумових процесів. Їх повідомлення багаті лексиконом і в них присутні іноземні слова.
А ось двієчники "удобрювали" свої тексти, в основному, смайлами і словами, написаними великими літерами. Також ця категорія користувачів мережі найчастіше обговорювала гороскопи, ДТП і службу в армії.
"Наші результати показали, наскільки вразливою є конфіденційність користувача в соціальній мережі. Люди переживають через всюдисущі камери і системи розпізнавання облич, проте, навіть / ... / короткий текст може стати джерелом інформації, яку людина не збиралася розкривати", - резюмували фахівці.