Исследователи из Чикаго сравнили производительность GPT-4o и DS DeepThink R1 на примере медицинского экзамена AMBOSS, чтобы оценить их потенциал и ограничения в качестве дополнительных инструментов в медицинском образовании. Как сообщает телеграм-канал "Медкарта", нейросети в этом случае обошли людей.