Mian Zhang

Research

My current research focuses on enhancing large language models (LLMs) for social good, with an emphasis on health-related domains. I am actively working on post-training (reinforcement learning and preference learning) and synthetic data generation to equip LLMs with complex and reliable abilities. Besides, I am interested in language agents and vision LLMs.

(* = equal contribution)

Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty

Peilin Wu*, Mian Zhang*, Xinlu Zhang, Xinya Du, Zhiyu Zoey Chen

Preprint

code

LMR-Bench: Evaluating LLM Agent's Ability on Reproducing Language Modeling Research

Shuo Yan, Ziming Luo, Zimu Wang, Ruochen Li, Daoyang Li, Liqiang Jing, Kaiyu He, Peilin Wu, Juntong Ni, George Michalopoulos, Yue Zhang, Ziyang Zhang, Mian Zhang, Zhiyu Chen, Xinya Du

Preprint

dataset and code

Preference Learning Unlocks LLMs' Psycho-Counseling Skills

Mian Zhang, Shaun M. Eack, Zhiyu Zoey Chen

Preprint

code dataset and models

Large Language Models for Disease Diagnosis: A Scoping Review

Shuang Zhou*, Zidu Xu*, Mian Zhang*, Chunpu Xu*, Yawen Guo, Zaifu Zhan, Sirui Ding, Jiashuo Wang, Kaishuai Xu, Yi Fang, Liqiao Xia, Jeremy Yeung, Daochen Zha, Mingquan Lin, Rui Zhang

npj Artificial Intelligence 2025

CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy

Mian Zhang*, Xianjun Yang*, Xinlu Zhang, Travis Labrum, Jamie C. Chiu, Shaun M. Eack, Fei Fang, William Yang Wang, Zhiyu Zoey Chen

NAACL 2025

dataset

IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction

Kaiyu He, Mian Zhang, Shuo Yan, Peilin Wu, Zhiyu Zoey Chen

ACL 2025

code and data

Inconsistent dialogue responses and how to recover from them

Mian Zhang, Lifeng Jin, Linfeng Song, Haitao Mi, Dong Yu

EACL 2024