ChatGPT может снижать навыки критического мышления - исследование

Баку, 20 июня, АЗЕРТАДЖ
Недавнее исследование, проведенное учеными из лаборатории Media Lab Массачусетского технологического института, выявило ряд настораживающих результатов относительно того, ухудшает ли использование ChatGPT навыки критического мышления.
Как передает АЗЕРТАДЖ со ссылкой на зарубежные СМИ, в ходе исследования 54 испытуемых в возрасте от 18 до 39 лет из Бостона были разделены на три группы, и им было предложено написать несколько эссе по SAT, используя ChatGPT от OpenAI, поисковую систему Google и вообще ничего не используя, соответственно. Исследователи использовали электроэнцефалограф для записи активности мозга авторов в 32 областях и обнаружили, что из трех групп пользователи ChatGPT имели самую низкую вовлеченность мозга и «постоянно отставали на нейронном, лингвистическом и поведенческом уровнях». В течение нескольких месяцев пользователи ChatGPT становились все ленивее с каждым последующим эссе, и к концу исследования часто прибегали к копированию и вставке.
Авторы статьи предполагают, что использование больших языковых моделей (LLM) может нанести вред обучению, особенно для молодых пользователей. Работа еще не прошла рецензирование, а размер выборки относительно невелик. Но главный автор работы Наталия Космина считает важным обнародовать результаты исследования, чтобы повысить обеспокоенность тем, что, поскольку общество все больше полагается на LLM для быстрого удобства, долгосрочное развитие мозга может быть принесено в жертву в процессе.
В последнее время MIT Media Lab выделила значительные средства на изучение различных последствий использования инструментов генеративного ИИ. Например, исследования, проведенные в начале этого года, показали, что чем больше времени пользователи тратят на общение с ChatGPT, тем более одинокими они себя чувствуют.
Космина, которая с 2021 года является штатным научным сотрудником MIT Media Lab, хотела специально изучить влияние использования искусственного интеллекта на школьную работу, поскольку все больше и больше студентов используют ИИ. Поэтому она и ее коллеги попросили испытуемых написать 20-минутные эссе на основе заданий SAT.
Группа, писавшая эссе с помощью ChatGPT, представила чрезвычайно похожие сочинения, в которых отсутствовала оригинальная мысль, а использовались одни и те же выражения и идеи. Два преподавателя английского языка, оценивавшие эти эссе, назвали их в основном «бездушными». Электроэнцефалограмма показала низкий уровень исполнительного контроля и вовлеченности внимания. А к третьему эссе многие авторы просто отдавали подсказку ChatGPT, и он выполнял почти всю работу. Это было больше похоже на «просто дайте мне эссе, доработайте это предложение, отредактируйте его, и я закончу», - говорит Космина.
Группа «только мозг», наоборот, показала самую высокую нейронную связь, особенно в альфа-, тета- и дельта-диапазонах, которые связаны с творческими идеями, нагрузкой на память и семантической обработкой. Исследователи обнаружили, что эта группа была более вовлеченной и любопытной, а также заявляла о своей ответственности и выражала большее удовлетворение от своих эссе.
Третья группа, которая использовала поиск Google, также выразила высокую удовлетворенность и активную работу мозга. Разница здесь заметна потому, что многие люди сейчас ищут информацию в чат-ботах с искусственным интеллектом, а не в Google Search.
После написания трех эссе испытуемых попросили переписать одно из своих предыдущих сочинений, но группа ChatGPT должна была сделать это без инструмента, в то время как группа, использующая только мозг, теперь могла использовать ChatGPT. Первая группа почти ничего не помнила о своих сочинениях и демонстрировала более слабые альфа- и тета-волны мозга, что, вероятно, отражало обход процессов глубокой памяти.
Вторая группа, напротив, показала хорошие результаты, продемонстрировав значительное увеличение связности мозга. Это позволяет надеяться, что при правильном использовании ИИ может повысить эффективность обучения, а не снизить ее.
Работа Косминой имеет свои ограничения. Исследование подвергается критике из-за небольшого размера выборки, сосредоточения исключительно на ChatGPT и ограничении только тестовыми заданиями, а также за недостаточное функциональное разделение анализируемых задач.