近日,華中農(nóng)業(yè)大學(xué)豬基因組與育種團(tuán)隊(duì)研究成果以“SIMER: an accurate and intelligent tool for simulating customizable population data across species in complex scenarios”為題在Journal of Big Data發(fā)表。研究開發(fā)出一款育種規(guī)劃與群體大數(shù)據(jù)模擬軟件“SIMER”,該軟件能夠根據(jù)數(shù)量遺傳學(xué)理論精確模擬不同復(fù)雜程度遺傳背景的多個(gè)世代基因型和具有豐富遺傳參數(shù)的多性狀表型大數(shù)據(jù),快速便捷地輔助育種者定制育種值評(píng)估模型和綜合選擇指數(shù)等育種規(guī)劃。
研究發(fā)現(xiàn),相比現(xiàn)有模擬軟件,SIMER具有以下三個(gè)獨(dú)有功能,一是目前唯一實(shí)現(xiàn)了多種繁殖方式的育種數(shù)據(jù)模擬工具,能夠模擬人類、動(dòng)物、植物和微生物的基因型數(shù)據(jù);二是能夠基于混合線性模型框架,利用用戶指定的協(xié)變量、固定效應(yīng)、隨機(jī)效應(yīng)、遺傳力及遺傳相關(guān)等復(fù)雜目標(biāo)參數(shù)來精準(zhǔn)模擬表型數(shù)據(jù);三是具有育種規(guī)劃制訂和比較功能,能夠助力育種者優(yōu)化育種方案。
作為連接遺傳學(xué)理論與實(shí)際應(yīng)用的橋梁,群體數(shù)據(jù)模擬是統(tǒng)計(jì)遺傳學(xué)研究領(lǐng)域中的重要環(huán)節(jié),尤其在統(tǒng)計(jì)模型的精準(zhǔn)性及穩(wěn)定性測(cè)試方面發(fā)揮不可替代的作用。然而,精準(zhǔn)的群體數(shù)據(jù)模擬存在繁殖方式不同的各物種基因型精準(zhǔn)模擬、具有復(fù)雜遺傳相關(guān)的表型精準(zhǔn)模擬和貼合生產(chǎn)實(shí)際的精準(zhǔn)育種規(guī)劃制訂等三個(gè)挑戰(zhàn)。為應(yīng)對(duì)上述挑戰(zhàn),SIMER實(shí)現(xiàn)了克隆、隨機(jī)交配、多元雜交等繁殖方式,創(chuàng)新了遺傳相關(guān)多性狀方差組分精準(zhǔn)模擬算法,通過基因型模擬、表型模擬、群體模擬和育種規(guī)劃制訂四大功能模塊來滿足遺傳育種研究和產(chǎn)業(yè)需求。
與同類工具相比,SIMER的優(yōu)勢(shì)體現(xiàn)在四個(gè)“準(zhǔn)確”。即在基因型模擬的“準(zhǔn)確”上,SIMER內(nèi)置了克隆、加倍單倍體繁殖、自交、隨機(jī)交配、排除自交的隨機(jī)交配和用戶指定系譜交配等單品種繁殖模式和二元雜交、三元雜交、四元雜交和回交等多品種繁殖模式用以精準(zhǔn)復(fù)現(xiàn)具有物種特異性的基因型數(shù)據(jù);在表型模擬的“準(zhǔn)確”上,SIMER能夠基于線性混合模型整合加性、顯性和上位等遺傳效應(yīng),以及協(xié)變量、固定效應(yīng)、隨機(jī)效應(yīng)和永久環(huán)境效應(yīng),同時(shí)創(chuàng)新了方差組分模擬算法,例如使用奇異值分解結(jié)合特征值分解的算法在消除原始遺傳效應(yīng)間隨機(jī)相關(guān)的基礎(chǔ)上構(gòu)建精確的多性狀遺傳相關(guān);在群體模擬的“準(zhǔn)確”上,SIMER可以靈活指定世代數(shù)、基因頻率分布等參數(shù)來精準(zhǔn)模擬不同復(fù)雜程度遺傳背景的育種群體,用戶可基于豐富的群體參數(shù)來模擬具有詳細(xì)系譜信息的多世代群體;在育種規(guī)劃制訂的“準(zhǔn)確”上,SIMER通過比較用戶制訂的多個(gè)育種規(guī)劃的遺傳進(jìn)展來選擇最佳設(shè)計(jì),規(guī)劃內(nèi)容包括開展基因分型和表型測(cè)定的個(gè)體選擇,優(yōu)化育種值評(píng)估模型中協(xié)變量、固定效應(yīng)和隨機(jī)效應(yīng),以及設(shè)計(jì)多個(gè)目標(biāo)性狀的綜合選擇指數(shù)。
SIMER致力于服務(wù)生命科學(xué)研究和育種實(shí)踐。在生命科學(xué)研究領(lǐng)域,SIMER能夠提供包含基因型和表型的群體大數(shù)據(jù)用以測(cè)試統(tǒng)計(jì)模型的準(zhǔn)確性、穩(wěn)定性及計(jì)算效率;在育種實(shí)踐領(lǐng)域,SIMER通過育種規(guī)劃制訂功能輔助育種者優(yōu)化育種值評(píng)估模型和綜合選擇指數(shù)用以增加目標(biāo)性狀遺傳增益及經(jīng)濟(jì)收益,也能輔助育種者選擇合適的個(gè)體進(jìn)行基因分型和表型測(cè)定,大幅減少育種成本。
華中農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院、動(dòng)物醫(yī)學(xué)院博士研究生殷東為論文第一作者,劉小磊教授為論文通訊作者,趙書紅教授、李新云教授、尹立林研究員參與并指導(dǎo)了該項(xiàng)工作。同時(shí),武漢理工大學(xué)研究生張軒寧、張浩浩等參與了該研究。該研究工作受到國家自然科學(xué)基金、湖北省國際科技合作項(xiàng)目、國家生豬產(chǎn)業(yè)技術(shù)體系等項(xiàng)目的資助。