Publications

Finding a Multiple Follower Stackelberg Equilibrium: A Fully First-Order Method
April Niu*, Kai Wang*, Juba Ziani* (in submission)

Bridging Constraints and Stochasticity: A Fully First-Order Method for Stochastic Bilevel Optimization with Linear Constraints
Cac Phan, Kai Wang (in submission)
Revealing Potential Biases in LLM-Based Recommender Systems in the Cold Start Setting
Alexandre Andre*, Gauthier Roy*, Eva Dyer, Kai Wang (EARL 2025 workshop)
One-Step Flow Policy Mirror Descent
Tianyi Chen, Haitong Ma, Na Li, Kai Wang*, Bo Dai* (in submission)
Non-Stationary Restless Multi-Armed Bandits with Provable Guarantee
Yu Heng Hung, Ping-Chun Hsieh, Kai Wang (in submission)
Neural Index Policies for Restless Multi-Action Bandits with Heterogeneous Budgets
Himadri S Pandey, Kai Wang, Gian-Gabriel P. Garcia (in submission)
Networked Restless Multi-Arm Bandits with Reinforcement Learning
Hanmo Zhang, Zenghui Sun, Kai Wang (PRL workshop AAAI 2025)

A Fully First-Order Layer for Differentiable Optimization
Zihao Zhao*, Kai-Chia Mo, Shing-Hei Ho, Brandon Amos, Kai Wang (ICML 2026, spotlight)
Diffusion-DFL: Decision-focused Diffusion Models for Stochastic Optimization
Zihao Zhao, Christopher Yeh, Lingkai Kong, Kai Wang (ICLR 2026)

Efficient Online Reinforcement Learning for Diffusion Policy
Haitong Ma, Tianyi Chen, Kai Wang, Li Na*, Bo Dai* (ICML 2025)
Opportunistic Screening of Type 2 Diabetes with Deep Metric Learning using Electronic Health Records
Qixuan Jin, Haoran Zhang, Lukasz Szczerbinski, Jiacheng Zhu, Walter Gerych, Xuhai Xu, Kai Wang, Sarah Hsu, Ravi Mandla, Aaron Deutsch, Alisa Manning, Josep Mercader, Thomas Hartvigsen, Miriam Udler, Marzyeh Ghassemi (Scientific Reports 2025)
Primal-Dual Spectral Representation for Off-policy Evaluation
Yang Hu, Tianyi Chen, Na Li, Kai Wang, Bo Dai (AISTATS 2025)
What is the Right Notion of Distance between Predict-then-Optimize Tasks?
Paula Rodriguez-Diaz, Lingkai Kong, Kai Wang, David Alvarez-Melis, Milind Tambe (UAI 2025)
What’s in a Query: Polarity-aware Distribution-based Fair Ranking
Aparna Balagopalan*, Kai Wang*, Olawale Elijah Salaudeen, Asia Biega, Marzyeh Ghassemi (WWW 2025)

Aligning Large Language Models with Representation Editing: A Control Perspective
Lingkai Kong, Haorui Wang, Wenhao Mu, Yuanqi Du, Yuchen Zhuang, Yifei Zhou, Yue Song, Rongzhi Zhang, Kai Wang, Chao Zhang (NeurIPS 2024)
Fully First-Order Methods for Linearly Constrained Bilevel Optimization
Guy Kornowski*, Swati Padmanabhan*, Kai Wang*, Zhe Zhang*, Suvrit Sra (NeurIPS 2024)

Characterizing and Improving the Robustness of Predict-Then-Optimize Frameworks
Sonja Johnson-Yu, Jessica Finocchiaro, Arunesh Sinha, Kai Wang, Yevgeniy Vorobeychik, Aparna Taneja, Milind Tambe (GameSec 2023)
Restless Multi-Armed Bandits for Maternal and Child Health: Results from Decision-Focused Learning
Shresth Verma, Aditya Mate, Kai Wang, Neha Madhiwalla, Aparna Hegde, Aparna Taneja, Milind Tambe (AAMAS 2023)
Optimistic Whittle Index Policy: Online Learning for Restless Bandits
Kai Wang*, Lily Xu*, Aparna Taneja, Milind Tambe (AAAI 2023)
Scalable Decision-Focused Learning in Restless Multi-Armed Bandits with Application to Maternal and Child Health
Kai Wang*, Shresth Verma*, Aditya Mate, Sanket Shah, Aparna Taneja, Neha Madhiwalla, Aparna Hegde, Milind Tambe (AAAI 2023)
Smoothed Online Combinatorial Optimization Using Imperfect Predictions
Kai Wang, Zhao Song, Georgios Theocharous, Sridhar Mahadevan (AAAI 2023)

Decision-Focused Learning without Decision-Making: Learning Locally Optimized Decision Losses
Sanket Shah, Kai Wang, Bryan Wilder, Andrew Perrault, Milind Tambe (NeurIPS 2022)
Coordinating Followers to Reach Better Equilibria: End-to-End Gradient Descent for Stackelberg Games
Kai Wang, Lily Xu, Andrew Perrault, Michael K. Reiter, and Milind Tambe (AAAI 2022)

Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning
Kai Wang, Sanket Shah, Haipeng Chen, Andrew Perrault, Finale Doshi-Velez, and Milind Tambe (NeurIPS 2021 spotlight presentation)
Dual-Mandate Patrols: Multi-Armed Bandits for Green Security
Lily Xu, Elizabeth Bondi, Fei Fang, Andrew Perrault, Kai Wang, and Milind Tambe (AAAI 2021 best paper runner up)

Automatically Learning Compact Quality-aware Surrogates for Optimization Problems
Kai Wang, Bryan Wilder, Andrew Perrault, and Milind Tambe (NeurIPS 2020 spotlight presentation)
Robust Spatial-Temporal Incident Prediction
Ayan Mukhopadhyay, Kai Wang, Andrew Perrault, Mykel Kochenderfer, Milind Tambe, and Yevgeniy Vorobeychik (UAI 2020)
Scalable Game-Focused Learning of Adversary Models:Data-to-Decisions in Network Security Games
Kai Wang, Andrew Perrault, Aditya Mate, and Milind Tambe (AAMAS 2020)

DeepFP for Finding Approximate Nash Equilibrium in Continuous Action Spaces
Nitin Kamra, Umang Gupta, Kai Wang, Fei Fang, Yan Liu, and Milind Tambe (GameSec 2019)
Learning to Signal in the Goldilocks Zone: Improving Adversary Compliance in Security Games
Sarah Cooney, Kai Wang, Elizabeth Bondi, Thanh Nguyen, Phebe Vayanos, Hailey Winetrobe, Edward Cranford, Cleotilde Gonzalez, Christian Lebiere, and Milind Tambe (ECML 2019)
Deep Fictitious Play for Games with Continuous Action Spaces
Nitin Kamra, Umang Gupta, Kai Wang, Fei Fang, Yan Liu, and Milind Tambe (Extended abstract in AAMAS 2019)
Adversarial Machine Learning with Double Oracle
Kai Wang, Bryan Wilder, and Milind Tambe (IJCAI 2019 Doctoral Consortium)
Improving GP-UCB Algorithm by Harnessing Decomposed Feedback
Kai Wang, Bryan Wilder, Sze-chuan Suen, Milind Tambe, and Bistra Dilkina (ECML 2019 SoGood Workshop; also appeared in the book of “Machine Learning and Knowledge Discovery in Databases”, in proceedings)

The Price of Usability: Designing Operationalizable Strategies for Security Games
Sara Marie Mc Carthy, Corine Laan, Kai Wang, Phebe Vayanos, Milind Tambe, and Arunesh Sinha (IJCAI 2018)
Equilibrium Refinement in Security Games with Arbitrary Scheduling Constraints
Kai Wang, Qingyu Guo, Phebe Vayanos, Milind Tambe, and Bo An (AAMAS 2018)
Strategic Coordination of Human Patrollers and Mobile Sensors with Signaling for Security Games
Haifeng Xu, Kai Wang, Phebe Vayanos, and Milind Tambe (AAAI 2018)