你好,我是张斯羽
Data Science & AI Researcher
多模态视觉语言模型 · 金融时间序列预测 · 智能系统开发
专注于遥感视觉语言模型、金融时间序列预测与智能系统开发,探索 AI 在遥感理解、金融科技与行业决策中的应用。
Multimodal Learning
Financial AI
Remote Sensing
Intelligent Systems
Research Focus
研究聚焦
AI
人工智能(Artificial Intelligence)
CV
计算机视觉(Computer Vision)
LLM
大语言模型(Large Language Model)
Featured Projects
精选项目
INCILABS 英思美妆实验室智能管理系统
项目是开发一款面向美妆研发实验室的智能信息管理系统。该系统通过人工智能、知识图谱、物联网等前沿技术,实现美妆实验室从配方设计、原料管理、实验记录、样品测试到安全评估的全流程数字化与智能化管理。
查看详情 →
基于多模态大语言模型的遥感图像精准理解——动态分辨率与多尺度视觉-语言对齐研究
本项目是一项面向遥感场景的多模态视觉语言智能理解研究,旨在解决传统遥感模型在复杂场景下存在的尺度变化大、细粒度目标难识别以及跨模态语义对齐不足等问题。项目基于Vision-Language Model(VLM)构建了“分辨率自适应”与“分层语义对齐”的统一框架,提出动态分辨率输入策略(DRIS)与多尺度视觉语言对齐机制(MS-VLAM),实现了遥感图像与文本语义之间的高效跨模态理解与多层级语义建模。项目采用PyTorch、Transformer、CLIP等技术完成模型训练与优化,并在RSICD、NWPU-Captions、RS-GPT4V等多个遥感数据集上完成实验验证,在遥感图像描述、视觉定位与跨模态推理任务中取得了较优性能,具备良好的泛化能力与研究价值。
查看详情 →Recent Insights
最新文章