崗位職責(zé)
1算法研發(fā)與優(yōu)化,設(shè)計(jì)實(shí)現(xiàn)訓(xùn)練和優(yōu)化用于原始測(cè)序信號(hào)(如電流信號(hào)熒光圖像)到DNA/RNA堿基序列轉(zhuǎn)換的深度學(xué)習(xí)模型(如CNN, RNN, Transformer, CTC等)。
2構(gòu)建基因組數(shù)據(jù)處理流程,構(gòu)建高效穩(wěn)定的數(shù)據(jù)預(yù)處理和后處理流水線,處理大規(guī)模高維度的原始測(cè)序數(shù)據(jù)。
3模型部署與性能提升,將訓(xùn)練好的模型部署到生產(chǎn)環(huán)境,并持續(xù)監(jiān)控評(píng)估其性能(如準(zhǔn)確率速度資源消耗),進(jìn)行迭代優(yōu)化。算法性能優(yōu)化,實(shí)現(xiàn)算法并行化與計(jì)算資源優(yōu)化。
4技術(shù)調(diào)研與創(chuàng)新,持續(xù)跟蹤AI和基因組學(xué)交叉領(lǐng)域的最新學(xué)術(shù)成果,探索并將前沿技術(shù)應(yīng)用于實(shí)際產(chǎn)品中。
任職要求
1計(jì)算機(jī)科學(xué)人工智能生物信息學(xué)統(tǒng)計(jì)學(xué)應(yīng)用數(shù)學(xué)或相關(guān)領(lǐng)域的碩士及以上學(xué)歷。
2扎實(shí)的機(jī)器學(xué)期與深度學(xué)習(xí)理論基礎(chǔ)。
3豐富的使用PyTorch/TensorFlow/Keras等框架進(jìn)行模型開(kāi)發(fā)和訓(xùn)練經(jīng)驗(yàn),熟悉主流深度學(xué)習(xí)架構(gòu)。
4精通Python,熟悉Linux開(kāi)發(fā)環(huán)境,具備優(yōu)秀的算法設(shè)計(jì)和編碼能力。熟悉R/C++等尤佳。
5熟練使用NumPy/Pandas/Scikit-learn等數(shù)據(jù)科學(xué)工具包,具備處理大規(guī)模數(shù)據(jù)集的實(shí)踐經(jīng)驗(yàn)。
6強(qiáng)大的邏輯思維能力問(wèn)題解決能力和創(chuàng)新意識(shí),具備優(yōu)秀的團(tuán)隊(duì)協(xié)作精神和溝通能力。
優(yōu)先考慮
1有生物信息學(xué)基因組學(xué)或計(jì)算生物學(xué)背景。了解高通量測(cè)序技術(shù)(如Illumina, ONT, PacBio)的原理和數(shù)據(jù)處理流程。
2有堿基識(shí)別(Base Calling)變異檢測(cè)(Variant Calling)基因組組裝(Genome Assembly)或相關(guān)生物信息學(xué)項(xiàng)目經(jīng)驗(yàn)。熟悉Bonito, Guppy, DeepVariant等工具者更佳。
3有處理時(shí)序信號(hào)(Time-series Data)或生物圖像分析的經(jīng)驗(yàn)。
4有模型量化剪枝蒸餾或高性能計(jì)算(HPC)GPU加速(CUDA)等模型優(yōu)化和部署經(jīng)驗(yàn)。
職位類別:
全職
舉報(bào)