Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures

Tyler A. Chang; Catherine Arnett; Abdelrahman Eldesokey; Abdelrahman Sadallah; Abeer Kashar; Abolade Daud; Abosede Grace Olanihun; Adamu Labaran Mohammed; Adeyemi Praise; Adhikarinayum Meerajita Sharma; Aditi Gupta; Afitab Iyigun; Afonso Simpl\'icio; Ahmed Essouaied; Aicha Chorana; Akhil Eppa; Akintunde Oladipo; Akshay Ramesh; Aleksei Dorkin; Alfred Malengo Kondoro; Alham Fikri Aji; Ali Eren \c{C}etinta\c{s}; Allan Hanbury; Alou Dembele; Alp Niksarli; \'Alvaro Arroyo; Amin Bajand; Amol Khanna; Ana Chkhaidze; Ana Condez; Andiswa Mkhonto; Andrew Hoblitzell; Andrew Tran; Angelos Poulis; Anirban Majumder; Anna Vacalopoulou; Annette Kuuipolani Kanahele Wong; Annika Simonsen; Anton Kovalev; Ashvanth.S; Ayodeji Joseph Lana; Barkin Kinay; Bashar Alhafni; Benedict Cibalinda Busole; Bernard Ghanem; Bharti Nathani; Biljana Stojanovska {\DJ}uri\'c; Bola Agbonile; Bragi Bergsson; Bruce Torres Fischer; Burak Tutar; Burcu Alaku\c{s} \c{C}{\i}nar; Cade J. Kanoniakapueo Kane; Can Udomcharoenchaikit; Catherine Arnett; Chadi Helwe; Chaithra Reddy Nerella; Chen Cecilia Liu; Chiamaka Glory Nwokolo; Cristina Espa\~na-Bonet; Cynthia Amol; DaeYeop Lee; Dana Arad; Daniil Dzenhaliou; Daria Pugacheva; Dasol Choi; Daud Abolade; David Liu; David Semedo; Deborah Popoola; Deividas Mataciunas; Delphine Nyaboke; Dhyuthy Krishna Kumar; Diogo Gl\'oria-Silva; Diogo Tavares; Divyanshu Goyal; DongGeon Lee; Ebele Nwamaka Anajemba; Egonu Ngozi Grace; Elena Mickel; Elena Tutubalina; Elias Herranen; Emile Anand; Emmanuel Habumuremyi; Emuobonuvie Maria Ajiboye; Eryawan Presma Yulianrifat; Esther Adenuga; Ewa Rudnicka; Faith Olabisi Itiola; Faran Taimoor Butt; Fathima Thekkekara; Fatima Haouari; Filbert Aurelian Tjiaranata; Firas Laakom; Francesca Grasso; Francesco Orabona; Francesco Periti; Gbenga Kayode Solomon; Gia Nghia Ngo; Gloria Udhehdhe-oze; Gon\c{c}alo Martins; Gopi Naga Sai Ram Challagolla; Guijin Son; Gulnaz Abdykadyrova; Hafsteinn Einarsson; Hai Hu; Hamidreza Saffari; Hamza Zaidi; Haopeng Zhang; Harethah Abu Shairah; Harry Vuong; Hele-Andra Kuulmets; Houda Bouamor; Hwanjo Yu; Iben Nyholm Debess; \.Ibrahim Ethem Deveci; Ikhlasul Akmal Hanif; Ikhyun Cho; In\^es Calvo; In\^es Vieira; Isaac Manzi; Ismail Daud; Itay Itzhak; Iuliia (Julia) Alekseenko; Ivan Belashkin; Ivan Spada; Ivan Zhelyazkov; Jacob Brinton; Jafar Isbarov; Jaka \v{C}ibej; Jan \v{C}uhel; Jan Koco\'n; Jauza Akbar Krito; Jebish Purbey; Jennifer Mickel; Jennifer Za; Jenny Kunz; Jihae Jeong; Jimena Tena D\'avalos; Jinu Lee; Jo\~ao Magalh\~aes; John Yi; Jongin Kim; Joseph Chataignon; Joseph Marvin Imperial; Jubeerathan Thevakumar; Judith Land; Junchen Jiang; Jungwhan Kim; Kairit Sirts; Kamesh R; Kamesh V; Kanda Patrick Tshinu; K\"atriin Kukk; Kaustubh Ponkshe; Kavsar Huseynova; Ke He; Kelly Buchanan; Kengatharaiyer Sarveswaran; Kerem Zaman; Khalil Mrini; Kian Kyars; Krister Kruusmaa; Kusum Chouhan; Lainitha Krishnakumar; Laura Castro S\'anchez; Laura Porrino Moscoso; Leshem Choshen; Levent Sencan; Lilja {\O}vrelid; Lisa Alazraki; Lovina Ehimen-Ugbede; Luheerathan Thevakumar; Luxshan Thavarasa; Mahnoor Malik; Mamadou K. Keita; Mansi Jangid; Marco De Santis; Marcos Garc\'ia; Marek Suppa; Mariam D'Ciofalo; Marii Ojastu; Maryam Sikander; Mausami Narayan; Maximos Skandalis; Mehak Mehak; Mehmet \.Ilteri\c{s} Bozkurt; Melaku Bayu Workie; Menan Velayuthan; Michael Leventhal; Micha{\l} Marci\'nczuk; Mirna Poto\v{c}njak; Mohammadamin Shafiei; Mridul Sharma; Mrityunjaya Indoria; Muhammad Ravi Shulthan Habibi; Murat Koli\'c; Nada Galant; Naphat Permpredanun; Narada Maugin; Nicholas Kluge Corr\^ea; Nikola Ljube\v{s}i\'c; Nirmal Thomas; Nisansa de Silva; Nisheeth Joshi; Nitish Ponkshe; Nizar Habash; Nneoma C. Udeze; Noel Thomas; No\'emi Ligeti-Nagy; Nouhoum Coulibaly; Nsengiyumva Faustin; Odunayo Kareemat Buliaminu; Odunayo Ogundepo; Oghojafor Godswill Fejiro; Ogundipe Blessing Funmilola; Okechukwu God'spraise; Olanrewaju Samuel; Olaoye Deborah Oluwaseun; Olasoji Akindejoye; Olga Popova; Olga Snissarenko; Onyinye Anulika Chiemezie; Orkun Kinay; Osman Tursun; Owoeye Tobiloba Moses; Oyelade Oluwafemi Joshua; Oyesanmi Fiyinfoluwa; Pablo Gamallo; Pablo Rodr\'iguez Fern\'andez; Palak Arora; Pedro Valente; Peter Rupnik; Philip Oghenesuowho Ekiugbo; Pramit Sahoo; Prokopis Prokopidis; Pua Niau-Puhipau; Quadri Yahya; Rachele Mignone; Raghav Singhal; Ram Mohan Rao Kadiyala; Raphael Merx; Rapheal Afolayan; Ratnavel Rajalakshmi; Rishav Ghosh; Romina Oji; Ron Kekeha Solis; Rui Guerra; Rushikesh Zawar; Sa'ad Nasir Bashir; Saeed Alzaabi; Sahil Sandeep; Sai Pavan Batchu; SaiSandeep Kantareddy; Salsabila Zahirah Pranida; Sam Buchanan; Samuel Rutunda; Sander Land; Sarah Sulollari; Sardar Ali; Saroj Sapkota; Saulius Tautvaisas; Sayambhu Sen; Sayantani Banerjee; Sebastien Diarra; SenthilNathan.M; Sewoong Lee; Shaan Shah; Shankar Venkitachalam; Sharifa Djurabaeva; Sharon Ibejih; Shivanya Shomir Dutta; Siddhant Gupta; Silvia Paniagua Su\'arez; Sina Ahmadi; Sivasuthan Sukumar; Siyuan Song; Snegha A.; Sokratis Sofianopoulos; Sona Elza Simon; Sonja Ben\v{c}ina; Sophie Gvasalia; Sphurti Kirit More; Spyros Dragazis; Stephan P. Kaufhold; Suba.S; Sultan AlRashed; Surangika Ranathunga; Taiga Someya; Taja Kuzman Punger\v{s}ek; Tal Haklay; Tasi'u Jibril; Tatsuya Aoyama; Tea Abashidze; Terenz Jomar Dela Cruz; Terra Blevins; Themistoklis Nikas; Theresa Dora Idoko; Thu Mai Do; Tilek Chubakov; Tommaso Gargiani; Uma Rathore; Uni Johannesen; Uwuma Doris Ugwu; Vallerie Alexandra Putra; Vanya Bannihatti Kumar; Varsha Jeyarajalingam; Varvara Arzt; Vasudevan Nedumpozhimana; Viktoria Ondrejova; Viktoryia Horbik; Vishnu Vardhan Reddy Kummitha; Vuk Dini\'c; Walelign Tewabe Sewunetie; Winston Wu; Xiaojing Zhao; Yacouba Diarra; Yaniv Nikankin; Yash Mathur; Yixi Chen; Yiyuan Li; Yolanda Xavier; Yonatan Belinkov; Yusuf Ismail Abayomi; Zaid Alyafeai; Zhengyang Shan; Zhi Rui Tam; Zilu Tang; Zuzana Nadova; Baber Abbasi; Stella Biderman; David Stap; Duygu Ataman; Fabian Schmidt; Hila Gonen; Jiayi Wang; David Ifeoluwa Adelani

arXiv:2510.24081·cs.CL·October 29, 2025

Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures

Tyler A. Chang, Catherine Arnett, Abdelrahman Eldesokey, Abdelrahman Sadallah, Abeer Kashar, Abolade Daud, Abosede Grace Olanihun, Adamu Labaran Mohammed, Adeyemi Praise, Adhikarinayum Meerajita Sharma, Aditi Gupta, Afitab Iyigun, Afonso Simpl\'icio, Ahmed Essouaied

PDF

2 Datasets

TL;DR

Global PIQA is a comprehensive, culturally-aware benchmark for evaluating physical commonsense reasoning across over 100 languages and cultures, revealing disparities in LLM performance especially in low-resource languages.

Contribution

It introduces a large-scale, culturally-diverse benchmark for multilingual commonsense reasoning, constructed by a global community of researchers, highlighting cultural and resource-based performance gaps in LLMs.

Findings

01

LLMs perform well overall but struggle with low-resource languages.

02

Open models generally underperform compared to proprietary models.

03

Many languages and cultures still lack sufficient everyday knowledge in LLMs.

Abstract

To date, there exist almost no culturally-specific evaluation benchmarks for large language models (LLMs) that cover a large number of languages and cultures. In this paper, we present Global PIQA, a participatory commonsense reasoning benchmark for over 100 languages, constructed by hand by 335 researchers from 65 countries around the world. The 116 language varieties in Global PIQA cover five continents, 14 language families, and 23 writing systems. In the non-parallel split of Global PIQA, over 50% of examples reference local foods, customs, traditions, or other culturally-specific elements. We find that state-of-the-art LLMs perform well on Global PIQA in aggregate, but they exhibit weaker performance in lower-resource languages (up to a 37% accuracy gap, despite random chance at 50%). Open models generally perform worse than proprietary models. Global PIQA highlights that in many…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Code & Models

Datasets

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.