首期班就業數據


AI相關崗位在互聯網、電商、智能硬件、游戲等多個行業的頭部公司中顯著緊缺,以阿里巴巴為例,人才緊缺度前10崗位中,6個均為AI相關崗位。小紅書緊缺度前10的崗位中,9個與AI相關。而SHEN的8個高緊缺度崗位中,4個均與AI相關。
在企業內容管理場景中,傳統分類模型往往面臨多級分類邏輯復雜、數據分布不均、難以與下游生成任務協同等挑戰。本項目旨在構建一個服務于智能發布流程的、具備深度理解能力的分類引擎。系統采用創新的層級化分類設計,通過預測最細粒度的三級分類并智能反推其上級類別。針對現實世界中常見的長尾數據分布問題,系統創造性融合了熱門類別的下采樣與冷門類別的大模型數據增強策略。
1.層級化分類設計:通過預測三級分類并反推上級類別,簡化多級分類任務。2.數據均衡化處理:采用熱門類別下采樣與冷門類別大模型數據增強策略。3.預訓練模型微調:選用bert-base-chinese模型,基于Huggingface Trans...
Python, Transformers, PyTorch, BERT, 下采樣, 數據增強
本項目致力于打破僵局,構建一套“能思考、會執行”的電商智能運營中臺。我們摒棄了單一的工具拼接,而是采用 Coze 和 Dify 編排復雜的業務流。在營銷端,系統不僅能通過知識庫實時捕捉抖音/微博熱點,更能結合通用性、獨特性、保障性三大維度智能提煉賣點。在服務端,系統化身為“金牌店長”,利用 LLM 強大的語義理解能力,對客服對話進行毫秒級的情感分析與意圖識別。
1.一個項目兩個平臺:采用 Coze 與 Dify 兩種方式實現,通過 Agent 與 Workflow 編排實現全鏈路自動化。2.閉環營銷:首創“熱點-賣點-買點-文案-海報”自動化營銷流。3.智能風控:集成釘釘機器人投訴分類助手,實時預...
Coze, Dify, Python, AIGC, LLM(DeepSeek/GPT), Google_Search_API, DingTalk, RAG
面對“某行業未來五年發展趨勢”這類模糊且龐大的需求,傳統的單輪問答系統往往顯得力不從心。本項目致力于構建一套具備自主規劃能力的全智深度研究系統。我們采用先進的多智能體協作架構(Multi-Agent Collaboration)。對于復雜課題,基于 SOP(標準作業程序)動態生成執行計劃。系統能夠像人類分析師一樣,自主調用工具對海量信息進行清洗、交叉驗證與深度挖掘。
1.SOP 動態編排:實現復雜任務的自動拆解、路徑規劃與動態調整。2.雙模態引擎:自適應切換 ReAct 單任務極速處理與 PlanSolve 多任務深度研判模式。3.全域工具集成:整合 DeepSearch、Python 代碼解釋器、專業...
Java, Python, FastAPI, SmolAgents, LiteLLM, Qdrant, ElasticSearch, React, MCP, SSE
隨著電商行業的數字化升級,商家面臨著海量的智能硬件設備管理挑戰。這些設備往往配有冗長晦澀的操作手冊,傳統的關鍵詞搜索無法精準匹配用戶語義化問題。本項目致力于解決這一痛點,構建一套基于大模型的高級 RAG(檢索增強生成)系統。采用最前沿的 LangGraph 框架編排復雜的業務邏輯,結合多模態模型解析復雜 PDF,并創新性地融合了向量檢索與知識圖譜。
1.前沿架構:基于 LangGraph 構建企業級可插拔 RAG 工作流。2.多模態處理:集成 MinerU 與 OCR,精準解析圖文混排 PDF。3.多路召回:向量檢索 + 稀疏檢索 + Neo4j 知識圖譜多路混合召回。4.智能切片:支...
Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j
醫院、醫生與科研人員每天處理大量醫學文獻、電子病歷及影像報告。傳統檢索難以理解臨床語義差異。本項目打造面向醫療行業的企業級高級 RAG 解決方案。基于 LangGraph 框架構建可溯源工作流。在數據解析端,融合 MinerU 與 OCR 攻克醫學圖文混排資料。在檢索端,創新整合向量檢索、稀疏檢索與臨床知識圖譜,實現多路召回機制;搭配 HyDE 與 BGE-Rerank 技術提升匹配精準度。
1.前沿架構:基于 LangGraph 構建可審計的企業級 RAG 工作流。2.多模態處理:精準解析醫學影像報告、EMR 及文獻。3.多路召回:向量+稀疏+臨床知識圖譜混合召回。4.智能切片:支持基于病例結構、滑動窗口等策略。5.深度優化:...
Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j
在線教育平臺需處理海量教材與多版本題庫。傳統搜索難以理解“這個函數題為什么要換元”等教育語義。本項目打造面向在線教育的企業級高級 RAG 系統。基于 LangGraph 構建可插拔工作流,覆蓋課程構建、教輔生成等任務。集成 MinerU 與 OCR 處理復雜教學材料。創新性融合向量檢索、稀疏檢索與教育知識圖譜,支撐題目解析與知識點推送。
1.前沿架構:基于 LangGraph 構建教育可插拔 RAG 工作流。2.多模態處理:精準解析教材、板書截圖、課件 PDF。3.多路召回:向量+稀疏+知識圖譜(課程體系/題庫)混合召回。4.智能切片:支持教育語義切分策略。5.深度優化:引...
Python, LangChain, LangGraph, OCR, MinerU, Milvus, HyDE, BGE-Rerank, RAGAS, Neo4j
面對數以千計的數據表,傳統 BI 難以滿足即時分析需求。本項目構建基于大模型的企業級 Text-to-SQL 智能問答系統。采用“多階段推理(Multi-stage Reasoning)”架構。在數據處理端,利用混合檢索精準定位關鍵表;在生成端,強制模型執行 CoT(思維鏈)——先拆解問題,再推導邏輯,最后生成 SQL。這不僅是 SQL 生成工具,更是會思考的虛擬數據分析師。
1.大廠開源內核:基于京東 DataAgent 深度定制。2.思維鏈驅動 NL2SQL:引入 Deep-Thinking 推理層,采用“重寫-思考-生成”架構。3.混合多路召回:Qdrant 向量檢索 + Elasticsearch 倒排索...
Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow
醫療數據系統繁多且結構復雜,臨床人員面臨“找不到、看不懂、不會查”的痛點。本項目構建基于大模型的醫療行業 Text-to-SQL 智能問答系統。系統采用“多階段推理”架構,在數據處理端通過混合檢索實現醫學術語與檢驗指標的雙通道檢索;在生成端強制執行 CoT 思維鏈。使系統在面對跨系統、跨科室的復雜臨床提問時,仍能生成可執行、可審計的 SQL。
1.大廠開源內核:基于 DataAgent 定制,強化醫療數據合規。2.思維鏈驅動 NL2SQL:確保復雜醫療查詢邏輯準確性。3.混合多路召回:醫學術語語義 + 檢驗指標數值混合召回。4.動態 Schema 剪枝:基于臨床語義自動剔除無關字...
Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow
面對海量課程與學習軌跡,傳統報表無法滿足實時洞察需求。本項目構建基于大模型的教育領域 Text-to-SQL 智能問答系統。采用“多階段推理”架構,創新融合向量檢索與倒排索引實現教學概念與行為數據的混合召回。系統強制執行 Deep-Thinking 思維鏈,先重寫教學問題,再推導查詢邏輯,最后生成符合合規要求的標準 SQL,幫助實現個性化干預與教學決策閉環。
1.大廠開源內核:基于 DataAgent 定制,強化教學質量監控。2.思維鏈驅動 NL2SQL:確保學習軌跡、多維效果分析等 SQL 邏輯準確。3.混合多路召回:教學概念 + 學生行為精準混合召回。4.動態 Schema 剪枝:降低 LL...
Python, FastAPI, Qdrant, Elasticsearch, LiteLLM, Jieba, AsyncIO, React, SSE, Agentic-Workflow
企業級數據應用中,傳統報表生成依賴人工,效率低且易遺漏。本項目旨在構建一套智能文摘引擎。采用輕量化大模型技術路線,基于 Qwen3-4B + LoRA 微調。系統深度理解運營、供應鏈等崗位需求,自動完成數據抽取與報告生成。通過強化對異常數據的智能診斷與核心信息的規則校驗,大幅壓縮報表制作時間,并支持長文本邏輯連貫分析,推動從被動匯報向主動決策升級。
1.輕量化大模型落地:Qwen3-4B + LoRA 微調,數據抽取準確率升至 96%。2.全崗位報表效率提升:日報/周報生成時間壓縮 70%-90%。3.復雜邏輯與長文本處理:支持趨勢分析與問題復盤。4.異常數據智能歸因:確保核心信息零遺...
Qwen3-4B, LoRA微調, Python, 加密傳輸與脫敏, 規則校驗引擎, 閉環反饋機制
在電商內容生成場景中,通用大模型難以穩定輸出符合情感傾向與風格要求的文本。本項目通過完整復刻并實施 RLHF(基于人類反饋的強化學習)全流程,將基礎大模型塑造成能夠精準理解并執行“生成積極正向商品評價”指令的專用智能體。我們嚴格遵循 RLHF 三階段范式:監督微調 (SFT) 奠定基礎,獎勵模型 (RM) 量化偏好,PPO 強化學習進行策略優化,實現模型行為的精準對齊。
1.嚴格遵循標準 RLHF 流程:SFT、RM、PPO 三階段精準對齊。2.監督微調奠基:基于電商評論數據集對 Qwen2.5-3B 進行 SFT。3.獎勵模型提供偏好信號:構建獎勵頭,量化文本情感偏好。4.PPO 強化學習對齊:以 SFT...
Python, PyTorch, Transformers, TRL, DeepSpeed, Qwen2.5, PPO, KL散度懲罰, GAE
傳統客服機器人常因用戶表達含糊或需要多輪交互而陷入死循環。本項目基于 Rasa 框架深度二次開發,構建具備深度感知能力的任務型客服系統。在 NLU 端,利用特征融合技術確保模型既懂“專業術語”也懂“口語表達”。在對話管理端,引入 TED Policy 利用注意力機制捕捉長距離上下文,讓機器人具備記憶能力,成為能理解情緒、主動服務的“金牌數字員工”。
1.行標級開源項目深度二開:深入 Rasa 源碼層定制。2.深度語義融合:Sparse + Dense 雙路特征提取。3.DIET 多任務學習:意圖分類與實體提取一體化。4.混合對話策略:Rule + ML (TED) 雙引擎驅動,拒絕“人...
Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker
醫療問診場景下,傳統機器人難以應對含糊表達或多輪問診。本項目構建具備深度語義感知能力的任務型醫療助手。基于 Rasa 進行深度二次開發,嚴格遵循工業級 NLP 流水線。在 NLU 端,將關鍵詞特征與 BERT 語義向量融合,確保讀懂口語化癥狀。在對話管理端,利用 RulePolicy 處理硬性流程,利用 TED Policy 捕捉長距離上下文,實現病情描述、用藥咨詢等復雜交互的記憶與處理。
1.開源項目深度二開:針對醫療場景定制 Rasa。2.深度語義融合:精準理解醫療術語與口語。3.DIET 多任務學習:提升訓練效率與識別準確率。4.混合對話策略:Rule 處理掛號,TED 處理問診。5.全鏈路特征工程:針對中文醫療語境優化...
Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker
在線教育場景中,傳統機器人常在跳躍式提問時卡殼。本項目構建具備深度理解與教學協同能力的任務型教育智能助手。基于 Rasa 深度定制,在 NLU 端融合 EduBERT 向量,精準解析課程名與學生口語。在對話管理端,應用 DIET 模型實現意圖與實體一體化解析,并利用 Rule+TED Policy 捕捉上下文,成為能記憶學習歷史、主動調用教務接口的“金牌數字教師助手”。
1.開源項目深度二開:支持課程咨詢、學習路徑推薦。2.深度語義融合:結合 EduBERT 理解教育術語。3.DIET 多任務學習:意圖分類與課程實體識別一體化。4.混合對話策略:處理自由問答與跳躍式咨詢。5.全鏈路特征工程:解決課程簡稱解析...
Python, Rasa, Pytorch, Jieba, BERT/ChineseBERT, DIET Classifier, TED Policy, Docker
傳統售后場景需求高度異構,單一系統難以應對。本項目構建具備自主決策能力的百應智能售后系統。采用 Multi-Agent Orchestration(多智能體編排)架構。核心中樞如“分診臺”般調度專業子智能體。利用 Text-to-SQL 直連數據庫查詢維修資源;通過 MCP 協議接入百度地圖打通線下服務。配合持久化記憶,實現集診斷、查詢、導航、導購于一體的售后服務智能總臺。
1.中控調度架構:基于 Orchestrator 的分診模式動態路由。2.Text-to-SQL:自然語言轉 SQL,精準查詢維修信息。3.時空智能集成:引入 MCP 協議對接百度地圖。4.領域知識 RAG:集成垂直知識庫處理硬件故障診斷。...
Python, Vue3, OpenAI-SDK, Orchestrator-Pattern, Text-to-SQL, MCP, BaiduMap-API, AsyncIO
針對中文互聯網圖文信息精準檢索的“語義鴻溝”問題,本項目打造專為中文場景設計的高效圖文檢索系統。采用部分參數凍結策略,僅解凍 CLIP 模型文本與視覺編碼器的末端層進行微調,高效注入中文語義理解。結合 AdamW 分組學習率等精細化訓練策略,確保穩定收斂。最終將優化后的模型與 Chroma 向量數據庫結合,構建端到端、低延遲的“文搜圖”閉環。
1.模型微調優化:基于 CLIP Chinese 模型續訓,采用部分參數凍結策略。2.訓練策略定制:使用 AdamW 分組學習率與早停機制。3.高效向量檢索:利用 HNSW 索引的 Chroma 數據庫實現快速搜索。4.端到端檢索流程:完成...
Python, CLIP-Chinese, PyTorch, Transformers, AdamW, Chroma, HNSW
本項目構建一套以預計算和高效融合為核心的多模態內容生成系統。采用創新的圖像表征預計算架構,訓練前通過凍結的 CLIP 模型提取圖像特征,大幅降低開銷。通過精心設計的提示詞模板與投影層,將圖像特征映射為提示詞序列,無縫嵌入語言模型輸入流。推理階段實時處理圖像,自動完成特征提取與標題生成,實現了高效、可控的多模態內容創作。
1.圖像表征預計算:提取并存儲特征,顯著提升訓練效率。2.數據集構建與提示工程:構建關聯數據集,利用模板指導學習。3.多模態特征融合:圖像特征映射為提示詞序列深度融合。4.高效訓練策略:采用帶預熱的 AdamW 與早停機制。5.推理流程自動...
Python, PyTorch, CLIP, Transformers, AdamW, 梯度裁剪, 自回歸采樣
本項目旨在構建一個能夠深度融合商品原圖結構、品牌專屬風格與營銷文案的高保真商品詳情頁智能生成系統。采用“數據精煉-分模塊微調-多條件融合-工程增強”方案。基于 Stable Diffusion,通過 LoRA 學習風格,微調 ControlNet 控制結構。推理時構建級聯管道,融合結構、文本與風格條件。引入 IP-Adapter 等技術作為保底,確保生成結果的可用性與一致性。
1.多條件數據集構建:構建“商品-詳情”與“商品-結構”對齊數據。2.條件生成模型與分模塊微調:LoRA 學習風格,ControlNet 提取結構。3.多模態控制信號融合推理:一次前向傳播融合所有條件。4.面向一致性的工程化增強:引入 IP...
Stable Diffusion, LoRA, ControlNet, IP-Adapter, 數據預處理, 多模態融合, 8位優化器
本階段 Python 課程特色鮮明,一方面全面培養學生的編程基礎,深入講解數據結構與控制結構,強調面向對象編程思想,重視文件操作、異常處理和模塊使用等實用技能,同時通過綜合案例提升實際問題解決能力,幫助學生熟練掌握 PyCharm 開發工具,還會介紹高級特性拓寬編程視野,深入講解進程與線程、網絡編程及正則表達式,注重理論與實踐結合,以豐富案例和實踐項目鞏固知識;另一方面會深入講解基礎數據結構與高效算法,針對各類問題分類教學,引入高級算法思想,為學生夯實基礎、提升程序效率,開拓編程思路,助力其提升解決復雜問題的能力,整體為學生未來發展打下堅實基礎。
本階段課程從 Linux 環境搭建入手,為后續學習奠定基礎。深入講解 MySQL 數據庫及數據處理工具 Numpy、Pandas,提升數據處理能力。通過多種可視化工具進行數據展示,注重理論與實踐結合,培養學生在 Linux 環境下的數據分析和可視化綜合能力。
本課程設計特色在于緊密結合數學基礎,涵蓋線性代數、概率、高數等知識,為后續算法學習筑牢根基。課程深入講解多種經典算法,如 線性回歸與邏輯回歸的原理和實現。通過豐富的案例實踐,讓學生切實掌握各種算法的應用場景和實現流程,培養學生解決實際問題的能力,使學生能夠在數據分析和機器學習領域中靈活運用所學知識,提升綜合競爭力。
本課程從深度學習的基礎概念入手,讓學生全面了解深度學習的應用場景與優缺點,為后續學習奠定認知基礎。深入講解 Pytorch 工具,涵蓋張量的多種操作,為學生提供強大的數據處理能力。在神經網絡方面,詳細介紹其各層結構、激活函數、損失函數等關鍵要素,使學生掌握構建神經網絡的核心知識。對于卷積神經網絡 CNN 和循環網絡 RNN,分別從圖像基礎和文本處理角度深入剖析,結合豐富案例幫助學生理解和應用。最后,通過電商圖片搜索項目,讓學生將所學知識轉化為實際應用能力,提升學生在深度學習領域的綜合素養和競爭力。
本階段課程以 NLP 為核心,從概念、發展歷史和應用場景出發,引領學生全面認識該領域。在文本預處理環節,深入傳授各種方法和技巧,為后續學習夯實基礎。對 RNN、LSTM、GRU 等經典模型進行詳細剖析,讓學生掌握不同模型的特點與應用。引入注意力機制和 Transformer 架構,拓展學生的知識深度與廣度。同時,通過對 fastText 工具的講解,包括文本分類和詞向量遷移等內容,提升學生的實際操作能力。課程還涵蓋了 BERT 和 ELMO 等前沿模型,讓學生緊跟技術發展潮流。最后,通過智能商品發布項目,將理論知識與實際應用緊密結合,培養學生解決實際問題的能力,提升學生在 NLP 領域的綜合競爭力。
本階段課程以大模型智能體為核心,從應用開發概述入手,全面介紹微調、RAG、提示詞技術和智能體基本構成要素,幫助學生建立完整的智能體知識體系。在框架技術方面,深入講解LangChain與LangGraph兩大主流框架,包括從基礎的Model I/O到復雜的Agent設計,從鏈式思維到圖狀工作流的思維轉變,全面提升學生的技術視野。課程注重企業級應用場景,通過商戶運營管家項目,帶領學生構建電商、自媒體等領域的AI應用;通過掌柜智庫項目,指導學生基于LangGraph構建企業級可插拔RAG工作流,集成多模態處理、多路召回和智能切片技術,解決真實業務問題。同時,提供醫療和教育領域項目實戰選擇,讓學生在特定垂直領域深入應用所學技能。最后,通過完整的項目開發流程訓練,結合git版本控制與團隊協作實踐,培養學生從需求分析到部署上線的全流程能力,使學生具備在企業環境中獨立開發和維護大模型智能體的綜合競爭力,為進入AI應用開發領域做好充分準備。
本階段課程以大模型核心技術為主線,從GPT、LLaMA、Qwen等主流模型原理講解入手,為學生構建扎實的理論基礎。在技術實踐層面,詳細剖析大模型微調的全流程,包括數據收集處理、參數高效微調技術、量化算法以及分布式訓練策略,使學生全面掌握大模型定制化的核心技能。課程深入講解強化學習在大模型優化中的前沿應用,從馬爾可夫決策過程等基礎理論,到PPO、DPO、GRPO等高級算法,再到RLHF的完整實現流程,通過智能評論等實戰項目,讓學生親身體驗從監督微調到強化學習對齊的全鏈路開發過程。在應用層面,課程精心設計了三大類型的實戰項目:對話系統類(電商小二、尚醫助手、知學助手)、數據分析類(掌柜問數、智醫問數、學情問數)和綜合智能體類(市場羅盤、萬應助手)。這些項目覆蓋了從開源項目深度定制、多路特征提取、混合對話策略,到思維鏈驅動NL2SQL、混合多路召回、動態Schema剪枝等企業級技術難點,全面提升學生解決復雜問題的能力。最終,通過這些系統化的理論學習與項目實戰,學生將建立起完整的大模型技術體系,具備在企業環境中進行大模型定制、優化和應用的全方位能力,為成為大模型領域的專業人才奠定堅實基礎。
本階段課程以多模態技術為主線,從基礎理論出發,逐步深入到具體模型的實現與應用。首先介紹多模態技術概論,幫助學生建立全面的知識框架。隨后詳細講解Vision Transformer(ViT)和CLIP模型的核心原理,并通過實際操作指導學生從零開始構建這些模型,完成具體的任務如圖片分類、“文搜圖”等,增強學生的動手能力。在進階部分,課程深入探討了ClipCap模型、擴散模型及其條件版本的應用場景和技術細節,讓學生不僅理解其背后的理論知識,還能親自實踐這些前沿技術。此外,通過講解OpenAI Dall-E2的核心原理,為學生打開了一扇通往文本到圖像生成的大門。項目實戰環節中,學生將有機會參與到智能檢索、智能發布(標題生成)等多個真實項目的開發過程中。每個項目都強調理論與實踐相結合,比如在智能檢索項目中,學生將學習模型微調優化、訓練策略定制等技能;而在智能發布項目中,則會深入探索多模態特征融合、數據集構建與提示工程等內容,最終達到提升解決實際問題能力的目的。整個課程設計旨在通過系統化的學習路徑,結合豐富的項目實踐,幫助學生掌握多模態技術的核心原理與應用場景,培養他們在跨域感知領域的綜合競爭力。
本階段課程主要圍繞學員的就業需求,在真正就業前,幫助學員多維度復習鞏固所學知識和項目,串講經典高頻面試題,傳授面試答題技巧,總結項目開發經驗,手把手簡歷指導,解決學員在就業過程中遇到的各種難題。
希望轉型
人工智能
大模型行業的
從事相關開發工作,
希望進一步
提升的
對新一代
AI大模型開發
感興趣的大學生
對人工智能
感興趣,
希望系統學習的