新芽专题介绍：基于课题关键词生成核心文献及代码资料的培养路径

Last updated on Oct 3, 2025

选择此专题并在新芽系列课程中获得优秀的同学，可以免去前期筛选考核流程，直接进入南开大学媒体计算团队以及国家人工智能学院等合作院校团队推免生招收面试的最后一轮。

一、专题介绍

1.1 研究背景

目前我们在学术研究中面临文献爆炸与信息过载的问题，随着各学科领域的飞速发展，学术文献和代码库（如GitHub）呈指数级增长。研究者，尤其是刚入门的研究生，面临着“从海量信息中快速精准定位核心知识”的巨大挑战。这导致了极高的认知负荷和时间成本。另外，现代重大科学问题往往需要交叉学科的知识。研究者需要快速掌握多个领域的核心脉络，传统的线性文献阅读方式难以胜任，需要一个快速检索核心文献的工具来帮助研究者学习交叉学科的知识。

1.2 研究意义

它可以作为一个平台或工具，显著提升科研工作者（特别是研究生）的文献调研和上手效率，极大降低科研入手门槛，加速科研进程。既可以帮助新手将长达数周甚至数月的、充满困惑的文献调研过程，缩短到几天，使其变得系统、清晰、高效；也可以帮助资深研究者和工程师快速进入一个相邻但不熟悉的新领域，抓住核心要点，避免重复造轮子，加速跨学科创新。

1.3 当前主要挑战

尽管方向重要，但实现红外弱小目标检测仍然面临多重挑战：

挑战一：技术实现困难
- 系统需要超越关键词匹配，推荐出的论文与代码必须要比关键词匹配出的要好。
- 如何将提取出的零散的核心文献组合成一条最优学习路径，是一个问题
挑战二：论文与代码的“质量”参差不齐

并非所有论文和代码都值得推荐。如何在海量资源中鉴别出高质量资源是一个很大的困难。

挑战三：评估难以进行

如何科学地衡量整个系统的成功是一个很大的挑战。没有现成的“标准路径”数据集可供测试。在线评估又必须依赖真实的用户实验，这样成本高、周期长。

综上，基于课题关键词生成核心文献及代码资料的培养路径的形成仍在探索初期，没有明确衡量标准，需求却很大，这是一个很好的学习窗口：所做既能运用科技前沿，又真实对大众有作用。

二、学习资料与参考文献

为了引导新芽学子逐步进入研究，本专题结构分为以下四部分：

2.1 基础教材与学习材料

在构建任何系统之前，必须深入理解其底层技术。您的课题需要三大支柱知识：机器学习/深度学习基础、自然语言处理（NLP） 和信息检索/知识图谱。

机器学习/深度学习 (ML/DL):

《Deep Learning》(Ian Goodfellow, Yoshua Bengio, Aaron Courville) - 奠定坚实的理论基础。
《动手学深度学习》(李沐) - 及其配套B站课程。极度推荐，完美结合理论与PyTorch代码实践。
PyTorch 官方教程，也可以使用 PyTorch 中文文档
《Transformers for Natural Language Processing》(Denis Rothman) - 专注于Transformer架构及其应用。
Hugging Face实战: Hugging Face课程 - 学习使用最主流的NLP工具库，这是您实现论文理解模块的关键技术。

此外，你也可以使用一些入门工具：

Google Colab：免费云平台，不用安装软件，就能跑PyTorch代码。
Kaggle平台：免费数据集和竞赛

Tips：务必摆脱所有基础都打好后，再进行下一阶段学习的心态，在干中学，遇到不明白的再回溯补基础。

2.2 入门文献

学生第一阶段的阅读训练，可帮助理解目标检测/语义分割/关键点检测这一通用方向。仅用于入门，不可选择此部分文献汇报。

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks (NeurIPS 2015）
YOLOv1 You Only Look Once: Unified, Real-Time Object Detection（CVPR2016）
SSD ：Single Shot MultiBox Detector(ECCV 2016）
FPN Feature Pyramid Networks for Object Detection(CVPR 2017)
RetinaNet Focal Loss for Dense Object Detection(ICCV 2017)
Toward Conversational Search and Recommendation: System Ask, User Respond (CIKM 2018)
SPECTER: Document-level Representation Learning using Citation-informed Transformers (ACL 2020)
A Survey of Scholarly Data Visualization (IEEE TVCG 2017)
VSM: The Vector Space Model of Text Retrieval: A Overview (Foundations and Trends in IR)
Cross-Domain Recommendation for Cold-Start Users via Neighborhood Based Feature Mapping (RecSys 2018)

2.3 进阶文献

学生可在此部分选择进阶文献进行专题汇报，或自行查找最新的同类重要文献。

DETR End-to-End Object Detection with Transformers(ECCV 2020)
Deformable DETR ： Deformable Transformers for End-to-End Object Detection(ICLR 2021)
Swin Transformer : Hierarchical Vision Transformer using Shifted Windows(ICCV 2021)
RT-DETR DETRs Beat YOLOs on Real-time Object Detection(CVPR 2024)
YOLOv10 : Real-Time End-to-End Object Detection(2024)
PaperQA: Retrieval-Augmented Generative Agent for Scientific Research (2023)
CodeNet: A Large-Scale AI for Code Dataset for Learning a Diversity of Coding Tasks (2021)
Knowledge Graphs for Explainable Artificial Intelligence (Foundations and Trends in AI 2022)
Recommending Scientific Videos Based on Content Relativity and Popularity (SIGIR 2021)
A Decade of Knowledge Graphs in Natural Language Processing: A Survey (AACL 2022)

2.4 领域相关文献

结合本专题的研究背景，逐渐引导学生进入基于课题关键词生成核心文献及代码资料的培养路径的课题。学生可在此部分选择进阶文献进行专题汇报，或自行查找最新的同类重要文献。

学术推荐系统:

MAPLE (KDD 2020) - 利用元路径学习为学者推荐论文。
SPECTER (ACL 2020) - 基于文档引用上下文生成论文嵌入，用于论文相似性计算和推荐，非常适合您的项目。
CiteTracker (JCDL 2022) - 追踪和推荐论文的引文轨迹。

科学知识图谱:

Survey on Scientific Knowledge Graphs (2020) - 科学知识图谱的综述，帮助您系统了解该领域。
ACL Anthology Knowledge Graph - 如何为ACL论文集构建知识图谱的实践案例。

LLM for Science:

SciNLP (2023) - 关于大语言模型在科学领域应用的综述。
PaperQA - 一个利用LLM对学术文献进行问答检索的开源工具，其技术思路值得借鉴。

资源质量评估:

CodeNet (2021) - IBM的大型代码数据集项目，包含代码质量评估等元数据。
How to Read a Paper (S. Keshav) - 这篇经典文章本身就可以转化为算法，用于评估论文的“可读性”和“结构清晰度”。

三、结语与期望

“新芽计划”的初衷是点燃新芽学子对未知探索的热情，并为大家提供一片成长的沃土。红外弱小目标检测是一个充满挑战与机遇的领域，它既是国家需求的“硬骨头”，也是学术创新的“试金石”。希望通过这个专题，新芽学子不仅能学到前沿的 AI 知识，更能培养出独立思考、动手实践和解决复杂问题的能力。

我们热切期待，在最终的汇报中，能看到大家闪耀着智慧火花的解读与创见！