工作職責:
具有大語言模型及通用人工智慧研究及分析能力,並具有演算法模型落地應用經驗,優化及遷移等工程能力;
研究並實踐開源大語言模型的私有化微調、部署、運行及評測;
跟蹤並分析業內相關技術動態,持續優化和改進現有模型;
瞭解和收集客戶的業務需求、整體應用程式組合和 IT 需求,為公司的產品或服務進行定制化的模型開發。
職位要求:
碩士畢業生,主修專業為計算機科學學科優先。
擁有至少兩年或以上的科研經驗,如:模型研發及工程應用。
熟悉業界領先大語言模型(GPT系列,LLaMA、ChatGLM等) 的基本原理與訓練方法,有文本生成和AI會話方面的研究經驗者優先。
有自然語言處理、人機交互、AIGC方向落地經驗者優先。
具備良好的程式設計能力,熟練掌握Python、Java、C/C++等主流程式設計語言。
熟悉深度學習框架的使用,包括Pytorch, transformers等,熟悉知識問答、搜索、知識圖譜等。
有意者請通過微信:job853Yco申請工作,謝謝!