综合精品天天夜夜久久,日本中文字幕二区区精品,亚洲欧美中文字幕制服二区,青青青国产爽爽视频免费观看

        中國(guó)基因網(wǎng)您的位置:首頁(yè) >行業(yè)資訊 >

        機(jī)器學(xué)習(xí)輔助的高性能有機(jī)光伏材料分子設(shè)計(jì)

        為了合成用于將太陽(yáng)輻射轉(zhuǎn)換成直流電的有機(jī)光伏(OPV)的高性能材料,材料科學(xué)家必須有意義地建立化學(xué)結(jié)構(gòu)與其光伏特性之間的關(guān)系。在一項(xiàng)關(guān)于科學(xué)進(jìn)步的新研究中,孫文博及其一個(gè)團(tuán)隊(duì),包括來(lái)自能源與動(dòng)力工程學(xué)院,自動(dòng)化學(xué)院,計(jì)算機(jī)科學(xué),電氣工程以及綠色和智能技術(shù)學(xué)院的研究人員,建立了一個(gè)新的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)使用1,700多種捐助材料現(xiàn)有文獻(xiàn)報(bào)告。他們使用監(jiān)督學(xué)習(xí) 使用機(jī)器學(xué)習(xí)模型來(lái)建立結(jié)構(gòu)-屬性關(guān)系,并使用針對(duì)不同ML算法的各種輸入來(lái)快速篩選OPV材料。

        機(jī)器學(xué)習(xí)輔助的高性能有機(jī)光伏材料分子設(shè)計(jì)

        使用超過(guò)1000位長(zhǎng)度的分子指紋(以二進(jìn)制位編碼分子的結(jié)構(gòu))。獲得了較高的ML預(yù)測(cè)精度。他們通過(guò)篩選10種新設(shè)計(jì)的供體材料以確保模型預(yù)測(cè)與實(shí)驗(yàn)結(jié)果之間的一致性,從而驗(yàn)證了該方法的可靠性。ML結(jié)果提供了一個(gè)強(qiáng)大的工具,可以預(yù)篩選新的OPV材料并加速材料工程中OPV的開(kāi)發(fā)。

        有機(jī)光伏(OPV)電池可以促進(jìn)太陽(yáng)能以直接且具有成本效益的方式轉(zhuǎn)換為電能,而最近的快速增長(zhǎng)使其超過(guò)了電能轉(zhuǎn)換效率(PCE)的速度。主流OPV研究集中在建立新的OPV分子結(jié)構(gòu)與其光伏特性之間的關(guān)系。傳統(tǒng)工藝通常涉及光伏材料的設(shè)計(jì)和合成,以用于光伏電池的組裝/優(yōu)化。這種方法導(dǎo)致耗時(shí)的研究周期,需要精細(xì)控制化學(xué)合成和裝置制造,實(shí)驗(yàn)步驟和純化。現(xiàn)有的OPV開(kāi)發(fā)過(guò)程緩慢且效率低下,到目前為止,合成和測(cè)試的 OPV供體分子 不足2000個(gè)。然而,從數(shù)十年研究工作中收集的數(shù)據(jù)是無(wú)價(jià)的,潛在價(jià)值仍有待充分探索以生成高性能OPV材料。

        為了從數(shù)據(jù)中提取有用的信息,Sun等人。需要一個(gè)復(fù)雜的程序來(lái)掃描大型數(shù)據(jù)集并從要素之間提取關(guān)系。由于機(jī)器學(xué)習(xí)(ML)提供了使用訓(xùn)練數(shù)據(jù)集學(xué)習(xí)和識(shí)別模式和關(guān)系的計(jì)算工具,因此該團(tuán)隊(duì)使用了數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)啟用ML并預(yù)測(cè)各種材料特性。機(jī)器學(xué)習(xí)算法不必了解材料屬性背后的化學(xué)或物理原理即可完成任務(wù)。最近類(lèi)似的方法已經(jīng)成功地預(yù)測(cè)了材料發(fā)現(xiàn),藥物開(kāi)發(fā)和生產(chǎn)過(guò)程中材料的活性/性質(zhì)。材料設(shè)計(jì)。在ML應(yīng)用之前,科學(xué)家已經(jīng)生成了化學(xué)信息學(xué)來(lái)建立有用的工具箱。

        材料科學(xué)家直到最近才探索 ML在OPV領(lǐng)域中的應(yīng)用。在目前的工作中,Sun等。建立了一個(gè)數(shù)據(jù)庫(kù),其中包含從文獻(xiàn)中收集的1719個(gè)經(jīng)過(guò)實(shí)驗(yàn)測(cè)試的供體OPV材料。他們首先研究了分子的語(yǔ)言表達(dá)對(duì)理解機(jī)器學(xué)習(xí)性能的重要性。然后,他們測(cè)試了幾種不同類(lèi)型的表達(dá)式,包括圖像,ASCII字符串,兩種類(lèi)型的描述符和七種類(lèi)型的分子指紋。他們觀察到模型預(yù)測(cè)與實(shí)驗(yàn)結(jié)果非常吻合。科學(xué)家們希望這種新方法能夠極大地加快用于OPV研究應(yīng)用的新型高效有機(jī)半導(dǎo)體材料的開(kāi)發(fā)。

        研究團(tuán)隊(duì)首先將原始數(shù)據(jù)轉(zhuǎn)換為機(jī)器可讀的表示形式。同一分子存在多種表達(dá)形式,包括以不同抽象水平呈現(xiàn)的極為不同的化學(xué)信息。Sun等使用一組ML模型。通過(guò)比較功率轉(zhuǎn)換效率(PCE)的預(yù)測(cè)準(zhǔn)確度,獲得了69.41%的深度學(xué)習(xí)模型,從而探索了分子的多種表達(dá)。相對(duì)較差的性能是由于數(shù)據(jù)庫(kù)較小。例如,以前,當(dāng)同一小組使用最多50,000個(gè)分子時(shí),深度學(xué)習(xí)模型的準(zhǔn)確性超過(guò)了90%。要全面訓(xùn)練深度學(xué)習(xí)模型,研究人員必須實(shí)施一個(gè)包含數(shù)百萬(wàn)個(gè)樣本的更大的數(shù)據(jù)庫(kù)。

        Sun等。目前每個(gè)類(lèi)別中只有數(shù)百個(gè)分子,因此模型很難提取足夠的信息來(lái)獲得更高的準(zhǔn)確性。盡管可以對(duì)預(yù)訓(xùn)練的模型進(jìn)行微調(diào)以減少所需的數(shù)據(jù)量,但仍需要成千上萬(wàn)的樣本來(lái)實(shí)現(xiàn)足夠數(shù)量的特征。當(dāng)使用圖像表達(dá)分子時(shí),這導(dǎo)致增加數(shù)據(jù)庫(kù)大小的選擇。

        科學(xué)家在研究中使用了五種類(lèi)型的監(jiān)督ML算法,包括(1)反向傳播(BP)神經(jīng)網(wǎng)絡(luò)(BPNN),(2)深度神經(jīng)網(wǎng)絡(luò)(DNN),(3)深度學(xué)習(xí),(4)支持向量機(jī)(SVM)和(5)隨機(jī)森林(RF)。這些是高級(jí)算法,其中BPNN,DNN和深度學(xué)習(xí)均基于人工中性網(wǎng)絡(luò)(ANN)。該SMILES碼Sun等人(簡(jiǎn)化的分子輸入線輸入系統(tǒng))提供了分子的另一種原始表達(dá)。用作四個(gè)模型的輸入。根據(jù)結(jié)果??,RF模型的最高準(zhǔn)確度約為67.84%。和以前一樣,與深度學(xué)習(xí)不同,這四種經(jīng)典方法無(wú)法提取隱藏特征。總體而言,SMILES作為圖像的分子描述符在預(yù)測(cè)數(shù)據(jù)中的PCE(功率轉(zhuǎn)換效率)等級(jí)方面表現(xiàn)不及圖像。

        然后,研究人員使用了分子描述符,該描述符可以使用數(shù)字?jǐn)?shù)組而不是化學(xué)結(jié)構(gòu)的直接表達(dá)來(lái)描述分子的特性。研究小組在研究中使用了兩種類(lèi)型的描述符PaDEL和RDKIt。在對(duì)所有ML模型進(jìn)行廣泛分析之后,大數(shù)據(jù)量意味著更多與PCE不相關(guān)的描述符會(huì)影響ANN性能。相比之下,當(dāng)使用分子描述符作為ML方法的輸入時(shí),小的數(shù)據(jù)量意味著無(wú)法有效地訓(xùn)練ML模型的化學(xué)信息,關(guān)鍵在于找到與目標(biāo)物體直接相關(guān)的合適描述符。

        團(tuán)隊(duì)接下來(lái)使用分子指紋 ; 通常設(shè)計(jì)為將分子表示為數(shù)學(xué)對(duì)象,最初是為了識(shí)別異構(gòu)體而創(chuàng)建的。在大規(guī)模數(shù)據(jù)庫(kù)篩選期間,該概念表示為包含“ 1”和“ 0”的位數(shù)組,以描述分子中是否存在特定的子結(jié)構(gòu)或模式。Sun等。使用七種類(lèi)型的指紋作為輸入來(lái)訓(xùn)練ML模型,并考慮了指紋長(zhǎng)度對(duì)不同模型的預(yù)測(cè)性能的影響,以獲得不同的指紋。例如,分子通道系統(tǒng) (MACCS)指紋包含166位,并且是最短的輸入,并且由于其信息有限而無(wú)法令人滿(mǎn)意。

        Sun等。展示了使用1024位雜交指紋和RF 獲得的編程語(yǔ)言和ML算法的最佳組合,可達(dá)到81.76%的預(yù)測(cè)精度;其中雜交指紋代表分子的SP2雜交狀態(tài)。當(dāng)指紋長(zhǎng)度從166位增加到1024位時(shí),所有ML模型的性能都會(huì)提高,因?yàn)楦L(zhǎng)的指紋會(huì)包含更多的化學(xué)信息。

        為了測(cè)試ML模型的可靠性,Sun等人。合成了10種新的OPV供體分子。然后使用三個(gè)具有代表性的指紋來(lái)表達(dá)新分子的化學(xué)結(jié)構(gòu),并比較RF模型和實(shí)驗(yàn)PCE值預(yù)測(cè)的結(jié)果。系統(tǒng)將10個(gè)分子中的8個(gè)分類(lèi)。結(jié)果表明了合成材料在OPV應(yīng)用中的潛力,另外還有兩種新材料的實(shí)驗(yàn)優(yōu)化。結(jié)構(gòu)上的細(xì)微變化可能會(huì)導(dǎo)致PCE值產(chǎn)生較大差異。令人鼓舞的是,機(jī)器學(xué)習(xí)模型識(shí)別出這樣的微小修改以利于良好的預(yù)測(cè)結(jié)果。

        這樣,Wenbo Sun及其同事使用了有關(guān)OPV供體材料的文獻(xiàn)數(shù)據(jù)庫(kù)和各種編程語(yǔ)言表達(dá)式(圖像,ASCII字符串,描述符和分子指紋)來(lái)構(gòu)建ML模型并預(yù)測(cè)相應(yīng)的OPV PCE類(lèi)。該團(tuán)隊(duì)演示了使用ML方法和實(shí)驗(yàn)分析設(shè)計(jì)OPV供體材料的方案。他們使用ML模型對(duì)大量供體材料進(jìn)行了預(yù)篩選,以鑒定合成和進(jìn)一步實(shí)驗(yàn)的主要候選對(duì)象。這項(xiàng)新工作可以加快新的供體材料設(shè)計(jì),從而加快高PCE OPV的開(kāi)發(fā)。ML與實(shí)驗(yàn)結(jié)合使用將促進(jìn)材料發(fā)現(xiàn)。

        鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

        推薦內(nèi)容