Способен ли ИИ помочь нам в дипломатии?
Исследования по применению больших языковых моделей (LLM) в политике начинают набирать обороты. Несмотря на впечатляющие успехи в понимании естественного языка, до сих пор не существовало бенчмарка, который бы охватывал все этапы принятия политических решений.
Исследователи восполнили этот пробел, разработав UNBench — комплексный бенчмарк для оценки LLM на основе данных Совета Безопасности ООН (СБ ООН).Резолюции СБ ООН часто ведут к санкциям, военным действиям или установлению миротворческих операций.
habr.com