单一组分化合物通常是定向合成、天然产物提取、发酵提取或半制备等方式制备得到,通过液相或气相等检测手段评估纯度(原料药纯度通常≥99.0%;杂质纯度通常≥90.0%)后,主要通过核磁共振氢谱(1H-NMR)、光谱及常规质谱(MS)等方法,基于合成机理推断平面结构;如合成机理不明确,采用提取方式获得,或氢谱及质谱等常规方法对化合物结构判断的信息作用不大,则需要投入更多确证方法来辅助结构判断,如借助碳谱(13C-NMR),二维核磁等来确证;在解析得到平面结构后,如判断存在立体构型,应采用针对立体结构相应的研究手段,如NOESY、圆二色谱(CD)、单晶衍射等进行确证。
化合物结构初步确证后,按照相关指导原则,笔者根据化合物类别,对原料药(新化学实体、已知化合物)、起始物料/中间体/杂质(新化合物、已知化合物)结构确证的相关研究内容列表整理如下[1~3]。
下文是笔者对曾用到的结构确证相关技术进行的简单阐述,因结构解析是一门系统的学科,内容较多且精深,在此不做具体结构解析的陈述。
与常规质谱相比,高分辨质谱(HRMS)测得化合物的分子量可精确至小数点后第四位,常用于辅助确定化合物的分子质量和和分子式,前提是通过核磁共振波谱已初步确定化合物结构。某些情况下,质谱可以起到结构确证的关键作用。笔者曾解析一新化合物,在初步推断得到平面结构后,发现分子量与推断的结构不一致。仔细观察质谱发现,在分子离子峰右侧还有一M+2的离子峰(丰度比约3:1),才恍然醒悟分子结构中含有氯原子,新化合物结构得以破解。卤素常有同位素峰,分子结构中存在的氯(Cl)和溴(Br)较典型,当分子中含有1个氯或溴时,相对丰度比分别为3:1或1:1;含有多个氯或溴时,笔者一般是手动计算,或采用Chemdraw中的Analysis m/z值来判断。质谱解析中还有一条大家都比较熟悉的“氮规则”:化合物分子不含氮或含偶数个氮原子时,其分子离子的质量是偶数;化合物分子含奇数个氮原子时,其分子离子的质量是奇数。元素分析对化合物中的各元素进行含量测定,确定各元素的百分含量。针对各元素的特点,元素分析可选择的方法较为多样。碳、氢、氮元素检测通常采用燃烧分解法;含卤素或硫的化合物,采用氧瓶燃烧-滴定法(中国药典2020年版四部通则0703);金属元素可采用电感耦合等离子发射光谱法(ICP-OES);磷元素可采用酸分解-比色法等。测定完毕,比较测试结果与理论结果差值的大小,指导原则[1]规定“一般要求误差不超过0.3%”,在实际遇到的一些案例中,会存在样品容易吸潮或化合物含较多游离水,导致测试结果与理论结果误差超过0.3%。在元素分析解析时,建议元素百分含量测定值扣除化合物的水分测定结果后,再与理论值比较误差。取化合物2mg~10mg装入核磁管,用合适的氘代试剂进行溶解,用核磁共振波谱仪(频率通常400M~800M)进行检测,内标物为四甲基硅烷(TMS)。1H的天然丰度较13C高很多,核磁测试时,两者频率通常是4倍关系,如氢谱(1H NMR)600M频率对应碳谱(13C NMR)150M频率;碳谱的响应较氢谱低,如果化合物量较少,在测试碳谱时,可通过积累扫描时长增加碳谱的响应;分子量大的化合物较分子量小的化合物检测用量要多。氘代试剂的选择也非常关键,比较常见的氘代试剂有DMSO-d6,CDCl3,D2O,Methanol-d4,(CD3)2CO等。某些情况下,化合物的化学位移可能与氘代试剂(或氘代试剂中存在的水)在氢谱或碳谱中的化学位移重叠,影响结构确证,就需要更换氘代试剂进行测定。指导原则[1]规定“对含有活泼氢的药物必需进行氘代实验,以提供活泼氢的存在以及位置的信息。”,选择氘代试剂时,可采用重水交换来确认活泼氢的存在。同时,可结合二维1H-1H COSY谱进行确认。核磁出图后,研发人员常用MestRenova软件对图谱进行化学位移和积分处理,采用Chemdraw软件预测化合物的氢谱和碳谱数据,辅助判断平面结构。如果化合物为已知化合物,通过与文献报道的氢谱(1H NMR)或碳谱(13C NMR)数据进行比对,则较易解析。微谱数据库可进行检索查新,目前数据库中已收载137万多种化合物的碳谱数据,为植物化学或天然产物研发工作者提供了较大的便利。只需在微谱数据库中录入已获得的碳谱数据,则能很快获得文献已发表化合物和待解析化合物的相似度。该数据库需要收费[4]。除了氢谱(1H NMR)和碳谱(13C NMR),DEPT(无畸变极化转移增强技术)和APT(碳连氢谱)也是一维核磁波谱。DEPT和APT谱用得较少,它们的作用是判断碳的类型。普通13C-NMR出的化学位移棒均是“朝上(正)”,DEPT和APT谱出的化学位移棒“有上(正)有下(负)”,常用135°DEPT。在135°DEPT实验中所有的季碳都不出峰,伯、叔碳为正(棒朝上),仲碳为负(棒朝下)。APT谱中季碳可以出峰,信号强度较DEPT谱增加。二维核磁共振波谱是对平面结构进行确证的关键。常用的为:HMBC(检出1H异核多键相干技术)、HSQC(检出1H异核单量子相干技术)、COSY(同核位移相关谱)、NOESY(核极化效应相关谱)。HMBC对推断结构最为高效,它是看相隔2个或3个键氢原子与碳原子的远程相关性;COSY(通常是1H-1HCOSY)看相邻碳相连氢原子的相关性;HSQC看直接相连的碳氢相关性。通常通过这三种技术,即可初步确认化合物的平面结构。JNP(Journalof Natural Products)杂志近期发表的某新的萜类化合物1的平面结构推断见图1,红色箭头表示的是根据HMBC谱推断的碳氢相关性,蓝色粗线表示的是1H-1H COSY谱推断的氢氢相关性。该化合物平面结构确证后,其相对构型通过NOESY谱进行确定,NOESY谱上可反映空间上的氢氢相关性,见图2,黑色箭头标出了空间氢原子相关。
图1 新化合物1平面结构(红色箭头:HMBC;蓝色粗线:key COSY)
图2 新化合物1空间NOE相关性(黑色箭头:NOESY)圆二色谱(CD)是用于推断非对称分子的构型和构象的一种旋光光谱,可用于确证化合物的绝对构型。上述新化合物1在通过二维核磁波谱确定了平面结构和相对构型后,通过圆二色谱计算结果与实验结果的拟合(见图3),最终确定了其绝对构型。
单晶X-射线衍射(XRSD)也是确定绝对构型的常用方法,可测定晶态分子的晶胞参数、晶系、空间群,可提供一个化合物在晶态中所具有原子的精确空间位置。该技术主要涉及单晶培养和检测。晶体培养难度较大,需不断尝试且有足够耐心。剑桥晶体数据中心(CCDC, the Cambridge Crystallographic Data Centre)自1965年起就从事晶体数据的收集、整理与计算机化工作,该中心发展的剑桥结构数据库系统CSDS(CSDS,the Cambridge Structural Database System)是基于X光和中子衍射实验唯一的小分子及金属有机分子晶体的结构数据库(网址:https://www.ccdc.cam.ac.uk/structures/),其中收录了113万多化合物的晶体结构,每一个化合物均有自己的CCDC编号[6]。图4是新化合物2的热椭圆形点图(ORTEP图)和CCDC数据库收录(CCDC编号:2048214)的3D动态模拟图截图[5]。
图4 新化合物2的ORTEP图及CCDC(编号:2048214)收录的3D动态模拟图截图除上述结构确证方法外,还有很多其他的结构确证技术,如红外、紫外、拉曼光谱、热重分析(TG)、差示扫描量热法(DSC)、旋光光谱等。红外光谱、热重分析(TG)、差示扫描量热法(DSC)、偏光显微镜法等对化合物晶型的判断也可起到辅助作用。某些化合物在固态时会表现出多晶型,多晶型会表现出红外光谱的差异;通常,结构中微小的差别会使红外光谱有很明显的差别[7]。老药组胺H2受体阻抗剂“西咪替丁”,参比制剂使用的原料药为A晶型,其原料药还存在另外三种晶型B、C、D,此外还有混合晶型。ABCD这四种晶型在红外光谱中的吸收存在微小差异(见下表),根据这些差异,可采用红外光谱来对A晶型产品进行鉴别[8]。此外,DSC也显示A晶型和B晶型在起始熔点和最高吸热峰存在差异,可用于晶型鉴别[9]。
本文对小分子化合物的结构确证方法进行了初步汇总,实际工作中,因化合物结构和性质差异,对结构确证技术方法的选择和应用应仔细剖析后使用。