Publications

See Google Scholar for the most recent list.

The Gemini team
Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities, Tech report 2025 [pdf]

The Gemini team
Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context, Tech report 2024 [pdf]

The Gemini team (core contributor)
Gemini: a family of highly capable multimodal models, Tech report 2023 [pdf]

Jiao Sun, Thibault Sellam, Elizabeth Clark, Tu Vu, Timothy Dozat, Dan Garrette, Aditya Siddhant, Jacob Eisenstein, Sebastian Gehrmann
Dialect-robust evaluation of generated text, ACL 2023 [pdf]

Elizabeth Clark, Shruti Rijhwani, Sebastian Gehrmann, Joshua Maynez, Roee Aharoni, Vitaly Nikolaev, Thibault Sellam, Aditya Siddhant, Dipanjan Das, Ankur P Parikh
SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization Evaluation, EMNLP 2023 [pdf]

Richard Yuanzhe Pang, Vishakh Padmakumar, Thibault Sellam, Ankur P. Parikh, He He
Reward Gaming in Conditional Text Generation, ACL 2023 [pdf]

Thibault Sellam, Ankur Bapna, Joshua Camp, Diana Mackinnon, Ankur P Parikh, Jason Riesa
SQuId: Measuring Speech Naturalness in Many Languages, ICASSP 2023 [pdf]

Sebastian Gehrmann, Elizabeth Clark, Thibault Sellam
A Case for Better Evaluation Standards in NLG., ML Evaluation Standards Workshop @ICLR 2022 (Outstanding Paper) [pdf]

Sebastian Gehrmann, Elizabeth Clark, Thibault Sellam
Repairing the Cracked Foundation: A Survey of Obstacles in Evaluation Practices for Generated Text, JAIR 2022 [pdf]

Thibault Sellam, Steve Yadlowsky, Jason Wei, Naomi Saphra, Alexander D'Amour, Tal Linzen, Jasmijn Bastings, Iulia Turc, Jacob Eisenstein, Dipanjan Das, Ian Tenney, Ellie Pavlick
The MultiBERTs: BERT Reproductions for Robustness Analysis, ICLR 2022 (Spotlight) [pdf]

The GEM Team
The GEM Benchmark: Natural Language Generation, its Evaluation and Metrics, The GEM workshop at ACL 2021 [pdf]

Amy Pu, Hyung Won Chung, Ankur P. Parikh, Sebastian Gehrmann, Thibault Sellam
Learning Compact Metrics for MT, EMNLP 2021 [pdf]

Thibault Sellam, Amy Pu, Hyung Won Chung, Sebastian Gehrmann, Qijun Tan, Markus Freitag, Dipanjan Das, Ankur P. Parikh
Learning to Evaluate Translation Beyond English: BLEURT Submissions to the WMT Metrics 2020 Shared Task, Conference on Machine Translation (WMT) 2020 [pdf]

Thibault Sellam, Dipanjan Das, Ankur P Parikh
BLEURT: Learning Robust Metrics for Text Generation, ACL 2020 [pdf]

Xavier Garcia, Pierre Foret, Thibault Sellam, Ankur P Parikh
A Multilingual View of Unsupervised Machine Translation, Findings of EMNLP 2020 [pdf]

Ran Tian, Shashi Narayan, Thibault Sellam and Ankur P. Parikh
Sticking to the Facts: Confident Decoding for Faithful Data-to-Text Generation, ArXiv 2019 [pdf]

In Data Management (Before 2019):

Qianrui Zhang, Haoci Zhang, Thibault Sellam, Eugene Wu
Mining Precision Interfaces from Query Logs, SIGMOD 2019 [pdf]

Thibault Sellam, Kevin Lin, Ian Yiran Huang, Michelle Yang, Carl Vondrick, Eugene Wu
DeepBase: Deep Inspection of Neural Networks, SIGMOD 2019 [pdf]

Yiru Chen, Yiliang Chi, Boyuan Chen, Thibault Sellam, Carl Vondrick, Eugene Wu
Deep Neural Inspection Using DeepBase, Systems for ML@NeurIPS 2018 [pdf]

Thibault Sellam, Kevin Lin, Ian Yiran Huang, Carl Vondrick, Eugene Wu
I Like the Way You Think! - Inspecting the Internal Logic of Recurrent Neural Networks, SysML 2018 [pdf]

Omar Alonso and Thibault Sellam
Quantitative Information Extraction From Social Data, SIGIR 2018 (short) [pdf]

Haoci Zhang, Viraj Rai, Thibault Sellam, Eugene Wu
Precision Interfaces for Different Modalities, SIGMOD 2018 (demo)

Haoci Zhang, Thibault Sellam, Eugene Wu
Mining Precision Interfaces From Query Logs, arXiv [pdf]

Haoci Zhang, Thibault Sellam, Eugene Wu
Precision Interfaces, HILDA@SIGMOD 2017 [pdf]

Eugene Wu, Fotis Psallidas, Zhengjie Miao, Haoci Zhang, Laura Rettig, Thibault Sellam
Combining Design and Performance in a Data Visualization Management System, CIDR 2017 [pdf]

Thibault Sellam, Martin Hentschel, Vasilis Kandylas, Omar Alonso
e#: Sharper Expertise Detection from Microblogs, EDBT 2016 [pdf]

Thibault Sellam, Martin Kersten
Fast, Explainable View Detection to Characterize Exploration Queries, SSDBM 2016 [pdf]

Thibault Sellam, Martin Kersten
80 New Packages to Mine Database Query Logs, arXiv [pdf]

Thibault Sellam, Martin Kersten
Have a Chat with Clustine, Conversational Engine to Query Large Tables, HILDA@SIGMOD 2016 [pdf]

Thibault Sellam, Martin Kersten
Ziggy: Characterizing Query Results for Data Explorers, VLDB 2016 (demo)

Thibault Sellam, Robin Cijvat, Richard Koopmanschap, Martin Kersten
Blaeu: Mapping and Navigating Large Tables with Cluster Analysis, VLDB 2016 (demo)

Thibault Sellam, Martin Kersten
Cluster-Driven Navigation of the Query Space, IEEE TKDE 2015

Thibault Sellam, Omar Alonso
Raimond: Quantitative Data Extraction from Twitter to Describe Events, ICWE 2015

Thibault Sellam, Emmanuel Müller, Martin Kersten
Semi-Automated Exploration of Data Warehouse, ACM CIKM 2015

Thibault Sellam, Martin Kersten
Meet Charles, Big Data Query Advisor, CIDR 2013

Thibault Sellam
Fast Cartography for Data Explorers, PhD workshop@VLDB 2013

Holger Pirk, Thibault Sellam, Stefan Manegold, Martin Kersten
X-device query processing by bitwise distribution, DaMoN@SIGMOD 2012

Konrad Bösche, Thibault Sellam, Holger Pirk, René Beier, Peter Mieth, Stefan Manegold
Scalable Generation of Synthetic GPS Traces with Real-Life Data Characteristics, TPCTC@VLDB 2012

Patents

Thibault Sellam and Omar Alonso (Microsoft)
Extraction of Quantitative Data from Online Content, US 20160203225

Omar Alonso, Martin Hentschel and Vasileios Kandylas and Thibault Sellam (Microsoft)
Expert Detection in Social Networks, US 20170249388