
近年來,對有機反應工藝的自主優(you) 化以及反應結果的大數據集的生成或使用都受到了重大關(guan) 注。然而,對於(yu) 反應優(you) 化仍然沒有明確的“最佳方法”。
2021年,Astex製藥公司和劍橋大學的合作研究,將預先存在的數據和自我優(you) 化算法結合在一起,發表了多任務優(you) 化算法(多任務貝葉斯優(you) 化,MTBO)。MTBO被視為(wei) “小數據”反應優(you) 化的最佳算法模型,當時該模型僅(jin) 使用計算機模擬示例進行了演示。

一、使用連續流反應器來演示MTBO算法:
流動化學反應器通常用於(yu) 一些危險化學反應的高傳(chuan) 質、傳(chuan) 熱和批量穩定生產(chan) 的需求,但它也能為(wei) 科學研究提供平台。與(yu) 傳(chuan) 統方法相比,流動反應器較少的反應物料、快速篩選反應條件有其優(you) 勢。
流動反應平台,可以對每個(ge) 單獨的實驗條件進行設置,並且可實現自動化。使用液體(ti) 處理器製備反應混合物也能夠在優(you) 化分類變量(例如,溶劑和配體(ti) )得到充分的研究。這是標準優(you) 化方法非常難以處理的考量因素。
二、用公開數據集進行計算機模擬與(yu) 連續流實驗優(you) 化演示
設想一下,在沒有進行任何先行實驗,隻需按下一個(ge) 按鈕就能得到最佳的反應條件,還有什麽(me) 工具比這更好的呢?
事實上,如果能使用現有的數據,例如開放Zenodo(由歐洲核子研究中心運作)反應數據庫和存儲(chu) 庫,計算機模擬就能實現這個(ge) 目標。
本文作者首先利用公開的Suzuki偶合和Buchwald-Hartwig數據集,進行了計算機模擬演示,然後進行實驗優(you) 化演示。
在計算機模擬的優(you) 化中,一個(ge) 關(guan) 鍵的發現是當存在多種不同的底物時就會(hui) 生產(chan) 更大的輔助數據集,MTBO算法似乎在更大的輔助數據集中運行得更好。這在Suzuki偶合案例中得到了很好的運用,當所有四個(ge) 可用的數據集都用於(yu) 輔助任務時,它提供了最佳的性能。
一般來說,人們(men) 會(hui) 假設可用的數據越多,優(you) 化的效率就越高。因此,這自然而然地反映了一個(ge) 科學家,尤其是工業(ye) 界科學家多年來一直在努力解決(jue) 的問題:我們(men) 如何有效地記錄和利用過去實驗的結果?阿斯利康、聖母大學和麻省理工學院的科學家最近發表的一篇論文也討論了這個(ge) 問題,特別是關(guan) 於(yu) 電子實驗室筆記本(ELN),並確保包括負麵數據也得到有效的使用。這將為(wei) 未來的機器學習(xi) 和人工智能提供有力的支持。

實驗室演示的C-H活化反應在含有較高比例極性官能團的小片段上進行,這是常用的合成方法,意義(yi) 重大。對於(yu) 藥物發現中的目標分子很適用。
盡管對不同反應性的底物來說,數據收集並不容易,但每個(ge) 底物的輔助數據集的增長使優(you) 化速率提升。訪問常用已公開的反應類型的實時數據集,可以減少對特定底物對實驗的依賴,快速得到最佳工藝條件,為(wei) 研究組帶來巨大優(you) 勢。

三、MTBO算法與(yu) 連續流反應結合未來應用潛力
MTBO現已可供他人使用,但還在不斷改進之中,不久我們(men) 將看到它巨大的潛力。改進包括,但不限於(yu) :
1、使用液滴流反應器等改進,以減少催化劑和原材料的消耗;
2、變量範疇的表示,目前是通過簡單地分配“1”和“0”對應於(yu) 每個(ge) 分類變量(稱為(wei) 一個(ge) 熱變量編碼、OHE)。其他選項,如主成分分析(PCA),可能有助於(yu) 包括有關(guan) 這些分類變量屬性的信息;
3、反應物的描述符也可以用來優(you) 先考慮在輔助任務數據集中最相似反應夥(huo) 伴的數據。
4、隨著反應優(you) 化從(cong) 經典方法演變,有機化學家將繼續看到新的有效選項被添加到他們(men) 的優(you) 化工具箱中,使得該工具更加被廣泛使用。
電話
關(guan) 注公眾(zhong) 號