Yankai Jiang - Homepage

👋 Hey, I’m Yankai Jiang, a researcher at the AI for Science Center, Shanghai Artificial Intelligence Laboratory.

I obtained my Ph.D. from the College of Computer Science and Technology at Zhejiang University, under the supervision of Prof. Hai Lin. My research interests include:

Multimodal Large Language Models Vision-Language Pretraining Self-supervised Learning Zero-shot Learning Open-vocabulary Segmentation Medical Image Analysis

📰 News

🔥 [2026.04.30] Four paper has been accepted by ICML 2026.
🔥 [2026.02.21] One paper has been accepted by CVPR 2026.
🔥 [2026.01.26] Two papers have been accepted by ICLR 2026.
🎉 [2025.09.19] One paper has been accepted by NeurIPS 2025.
🎉 [2025.06.26] One paper has been accepted by ICCV 2025.
🎉 [2025.05.20] One paper has been accepted by ICML 2025.
🎉 [2025.03.08] Two papers have been accepted by CVPR 2025.
🎉 [2025.01.30] One paper has been accepted by ICLR 2025.
🎉 [2024.12.09] One paper has been accepted by AAAI 2025.
🎉 [2024.09.26] One paper has been accepted by NeurIPS 2024.
🎉 [2024.03.08] One paper has been accepted by CVPR 2024.
📄 [2023.12.18] One paper has been published by IEEE Transactions on Antennas and Propagation.
🎉 [2023.07.01] One paper has been accepted by ICCV 2023 as an Oral presentation.
📄 [2022.10.30] One paper has been published by Computer Graphics Forum.
🎉 [2022.06.30] One paper has been accepted by MICCAI 2022 as an Early Accepted paper.
🎉 [2022.04.30] One paper has been accepted by IJCAI 2022.
🎉 [2021.12.30] One paper has been accepted by BIBM 2021.
📄 [2021.10.01] One paper has been published by Oral Radiology.
📄 [2021.08.01] One paper has been published by IEEE Transactions on Medical Imaging.
📄 [2020.11.30] One paper has been published by Journal of Molecular Neuroscience.
📄 [2020.05.28] One paper has been published by Frontiers in Oncology.

📚 Selected Publications

The full list can be accessed on Google Scholar. (*: Equal contribution; †: Corresponding author(s))

🤖 MLLM Agents: Towards Tool-Augmented Multi-Round Interaction with Agentic RL

[CVPR] IBISAgent: Reinforcing Pixel-Level Visual Reasoning in MLLMs for Universal Biomedical Object Referring and Segmentation, Yankai Jiang, Qiaoru Li, Binlu Xu, Haoran Sun, Chao Ding, Junting Dong, Yuxiang Cai, Xuhong Zhang, Jianwei Yin, CVPR, 2026
[ICML] Incentivizing Tool-augmented Thinking with Images for Medical Image Analysis, Yankai Jiang, Yujie Zhang, Peng Zhang, Yichen Li, Jintai Chen, Xiaoming Shi, Shihui Zhen, 2025
[ICML] MedScope: Incentivizing "Think with Videos" for Clinical Reasoning via Coarse-to-Fine Tool Calling, Wenjie Li, Yujie Zhang, Haoran Sun, Xingqi He, Hongcheng Gao, Chenglong Ma, Ming Hu, Guankun Wang, Shiyi Yao, Renhao Yang, Hongliang Ren, Lei Wang, Junjun He, Yankai Jiang^†, 2026
[arXiv] Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning, Jiaxuan Lu, Ziyu Kong, Yemin Wang, Rong Fu, Haiyuan Wan, Cheng Yang, Wenjie Lou, Haoran Sun, Lilong Wang, Yankai Jiang, Xiaosong Wang, Xiao Sun, Dongzhan Zhou, 2026
[arXiv] Think Twice to See More: Iterative Visual Reasoning in Medical VLMs, Kaitao Chen, Shaohao Rui, Yankai Jiang, Jiamin Wu, Qihao Zheng, Chunfeng Song, Xiaosong Wang, Mu Zhou, Mianxin Liu, 2025

🔬 Vision-Language Pretraining and MultiModal Foundation Models for Biomedicine

[CVPR] Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models, Yankai Jiang, Peng Zhang, Donglin Yang, Yuan Tian, Hai Lin, Xiaosong Wang, CVPR, 2025
[ICLR] Unleashing the Potential of Vision-Language Pre-Training for 3D Zero-Shot Lesion Segmentation via Mask-Attribute Alignment, Yankai Jiang, Wenhui Lei, Xiaofan Zhang, Shaoting Zhang, ICLR, 2025
[CVPR] ZePT: Zero-Shot Pan-Tumor Segmentation via Query-Disentangling and Self-Prompting, Yankai Jiang, Zhongzhen Huang, Rongzhao Zhang, Xiaofan Zhang, Shaoting Zhang, CVPR, 2024
[NeurIPS] CAT: Coordinating Anatomical-Textual Prompts for Multi-Organ and Tumor Segmentation, Zhongzhen Huang, Yankai Jiang, Rongzhao Zhang, Shaoting Zhang, Xiaofan Zhang, NeurIPS, 2024
[arXiv] TK-Mamba: Marrying KAN with Mamba for Text-Driven 3D Medical Image Segmentation, Haoyu Yang, Yutong Guan, Meixing Shi, Yuxiang Cai, Jintao Chen, Sun Bing, Wenhui Lei, Mianxin Liu, Xiaoming Shi, Yankai Jiang, Jianwei Yin, 2025
[arXiv] A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation, Wenhui Lei, Hanyu Chen, Zitian Zhang, Luyang Luo, Qiong Xiao, Yannian Gu, Peng Gao, Yankai Jiang, Ci Wang, Guangtao Wu, Tongjia Xu, Yingjie Zhang, Xiaofan Zhang, Pranav Rajpurkar, Shaoting Zhang, Zhenning Wang, 2025

🧠 LLM Reasoning and Application for Science

[ICLR] Unleashing Scientific Reasoning for Bio-experimental Protocol Generation via Structured Component-based Reward Mechanism, Haoran Sun*, Yankai Jiang*^†, Zhenyu Tang, Yaning Pan, Shuang Gu, Zekai Lin, Lilong Wang, Wenjie Lou, Lei Liu, Lei Bai, Xiaosong Wang, ICLR, 2026
[NeurIPS] Chiron-o1: Igniting Multimodal Large Language Models towards Generalizable Medical Reasoning via Mentor-Intern Collaborative Search, Haoran Sun, Yankai Jiang*^†, Wenjie Lou, Yujie Zhang, Wenjie Li, Lilong Wang, Mianxin Liu, Lei Liu, Xiaosong Wang, NeurIPS, 2025
[ACL] Flow2Code: Evaluating Large Language Models for Flowchart-Based Code Generation Capability, Mengliang He, Jiayi Zeng, Yankai Jiang, Wei Zhang, Zeming Liu, Xiaoming Shi, Aimin Zhou, ACL Findings, 2025
[ICLR] Mix-Ecom: Towards Mixed-Type E-Commerce Dialogues with Complex Domain Rules, Chenyu Zhou, Xiaoming Shi, Hui Qiu, Xiawu Zheng, Haitao Leng, Yankai Jiang, Shaoguo Liu, Tingting Gao, Rongrong Ji, ICLR, 2026
[arXiv] Mediator-Guided Multi-Agent Collaboration among Open-Source Models for Medical Decision-Making, Kaitao Chen, Mianxin Liu, Daoming Zong, Chaoyue Ding, Shaohao Rui, Yankai Jiang, Mu Zhou, Xiaosong Wang, 2025
[arXiv] RareAgent: Self-Evolving Reasoning for Drug Repurposing in Rare Diseases, Lang Qin, Zijian Gan, Xu Cao, Pengcheng Jiang, Yankai Jiang, Jiawei Han, Kaishun Wu, Jintai Chen, 2025
[arXiv] SCP: Accelerating Discovery with a Global Web of Autonomous Scientific Agents, Yankai Jiang, Wenjie Lou, Lilong Wang, Zhenyu Tang, Shiyang Feng, Jiaxuan Lu, Haoran Sun, Yaning Pan, Shuang Gu, Haoyang Su, Feng Liu, Wangxu Wei, Pan Tan, Dongzhan Zhou, Fenghua Ling, Cheng Tan, Bo Zhang, Xiaosong Wang, Lei Bai, Bowen Zhou, 2025
[arXiv] InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery, Shiyang Feng, Runmin Ma, Xiangchao Yan, Yue Fan, Yusong Hu, Songtao Huang, Shuaiyu Zhang, Zongsheng Cao, Tianshuo Peng, Jiakang Yuan, Zijie Guo, Zhijie Zhong, Shangheng Du, Weida Wang, Jinxin Shi, Yuhao Zhou, Xiaohan He, Zhiyin Yu, Fangchen Yu, Qihao Zheng, Jiamin Wu, Mianxin Liu, Chi Zhang, Shaowei Hou, Shuya Li, Yankai Jiang, Wenjie Lou, Lilong Wang, Zifu Wang, Jiong Wang, Wanghan Xu, Yue Deng, Dongrui Liu, Yiheng Wang, Wenlong Zhang, Fenghua Ling, Shufei Zhang, Xiaosong Wang, Shuangjia Zheng, Xun Huang, Siqi Sun, Shuyue Hu, Peng Ye, Chunfeng Song, Bin Wang, Conghui He, Yihao Liu, Xin Li, Qibin Hou, Tao Chen, Xiangyu Yue, Liang He, Dahua Lin, Bowen Zhou, Bo Zhang, Lei Bai, 2026

🏥 Medical Image Understanding: Detection, Classification, and Segmentation

[ICCV (Oral)] Anatomical Invariance Modeling and Semantic Alignment for Self-supervised Learning in 3D Medical Image Analysis, Yankai Jiang, Mingze Sun, Heng Guo, Xiaoyu Bai, Ke Yan, Le Lu, Minfeng Xu, ICCV, 2023 (Oral Presentation)
[IJCAI (Oral)] SatFormer: Saliency-Guided Abnormality-Aware Transformer for Retinal Disease Classification in Fundus Image, Yankai Jiang, Ke Xu, Xinyue Wang, Yuan Li, Hongguang Cui, Yubo Tao, Hai Lin, IJCAI, 2022 (Oral Presentation)
[MICCAI (Early Accepted)] CephalFormer: Incorporating Global Structure Constraint into Visual Features for General Cephalometric Landmark Detection, Yankai Jiang, Yiming Li, Xinyue Wang, Yubo Tao, Jun Lin, Hai Lin, MICCAI, 2022 (Early Accepted Paper)
[TMI] Ala-net: Adaptive Lesion-Aware Attention Network for 3D Colorectal Tumor Segmentation, Yankai Jiang, Shufeng Xu, Hongjie Fan, Jiahong Qian, Weizhi Luo, Shihui Zhen, Yubo Tao, Jihong Sun, Hai Lin, IEEE Transactions on Medical Imaging, 2021
[BIBM] DeepNFT: Towards Precise Neurofibrillary Tangle Detection via Improving Multi-scale Feature Fusion and Adversary, Yankai Jiang, Lei Zhang, Yiming Li, Xiangyang He, Hanxiao Huang, Keqing Zhu, Yubo Tao, Hai Lin, BIBM, 2021
[Oral Radiology] LRVRG: A Local Region-Based Variational Region Growing Algorithm for Fast Mandible Segmentation from CBCT Images, Yankai Jiang, Jiahong Qian, Shijuan Lu, Yubo Tao, Jun Lin, Hai Lin, Oral Radiology, 2021
[J. Mol. Neurosci.] Quantitative Assessment of Hippocampal Tau Pathology in AD and PART, Lei Zhang*, Yankai Jiang*, Jie Zhu, Huazheng Liang, Xiangyang He, Jiahong Qian, Hai Lin, Yubo Tao, Keqing Zhu, Journal of Molecular Neuroscience, 2020
[AAAI] SIGraph: Saliency Image-Graph Network for Retinal Disease Classification in Fundus Image, Peng Zhang, Yuan Li, Haotian Song, Yankai Jiang, Yubo Tao, Hai Lin, Hongguang Cui, AAAI, 2025
[CVPR] Towards All-in-One Medical Image Re-Identification, Yuan Tian, Kaiyuan Ji, Rongzhao Zhang, Yankai Jiang, Chunyi Li, Xiaosong Wang, Guangtao Zhai, CVPR, 2025
[ICCV] Semantic versus Identity: A Divide-and-Conquer Approach towards Adjustable Medical Image De-Identification, Yuan Tian, Shuo Wang, Rongzhao Zhang, Zijian Chen, Yankai Jiang, Chunyi Li, Xiangyang Zhu, Fang Yan, Qiang Hu, XiaoSong Wang, Guangtao Zhai, ICCV, 2025
[CGF] MeshFormer: High-Resolution Mesh Segmentation with Graph Transformer, Yuan Li, Xiangyang He, Yankai Jiang, Huan Liu, Yubo Tao, Hai Lin, Computer Graphics Forum, 2022

🏆 Awards

🥇 [2024.04], CVPR 2024 Outstanding Reviewer (Top 1%)
🏅 [2022.11], Honorable Mention Award in MICCAI 2022 FLARE Challenge (Top 2%)
🏅 [2022.10], Huawei Fundamental Research Scholarship (Top 3%)
🏅 [2021.10], Outstanding Doctoral Student Scholarship (Top 3%)
🏅 [2020.10], Outstanding Doctoral Student Scholarship (Top 3%)
🏅 [2018.10], Doctoral Freshman Scholarship (Top 3%)
🥇 [2017.12], First Prize in the Mathematical Contest in Modeling (MCM), USA (Top 1%)
🥇 [2017.10], National Scholarship (Undergraduate) (Top 1%)
🥇 [2016.10], National Scholarship (Undergraduate) (Top 1%)
🥇 [2015.10], National Scholarship (Undergraduate) (Top 1%)

📋 Professional Services

📌 Reviewer for Conferences: NeurIPS, ICLR, ICML, AAAI, IJCAI, ACM MM, CVPR, ICCV, ECCV.
📌 Reviewer for Journals: TPAMI, TCSVT, TMI, MIA, JBHI.