1-4. 冠狀病毒主要蛋白酶晶體解析
由於蛋白酶掌控了 SARS 病毒複製的主要關鍵,如果病毒無法順利複製,對人體所造成的破壞也就大大降低,因此影響蛋白酶活性使其降低或消失便成為抑制劑開發的主要目的。此外要評估一個化合物是否具有良好的抑制性,則必須要先知道該化合物與其作用酵素或是蛋白酶在三度空間結構上的結合位置與結合能力,並加以分析我們所設計出來的藥物對於蛋白酶的抑制點在哪一個精確的位置,如此才可以評估相關衍生物的設計與製備的執行方向。
回顧 2003 年至今的這段時間,除了 SARS 主要蛋白酶結晶構型被解析出來之外,亦有許多的研究團隊針對人類冠狀病毒蛋白酶的基因組與其他物種的冠狀病毒基因組進行序列與構型之比對,然後再利用分子模擬計算的方法於現有的分子資料庫當中找尋適當的前導藥物作為合成具有抵抗 SARS 疾病藥物之主架構。同時也有許多的研究團隊發表了冠狀病毒與其他相關病毒之間在其型態、結構、生化、基因組、水解酶等構成冠狀病毒主要架構之間的關係。
藉由 X-ray 晶格構型解析技術對於 SARS 冠狀病毒之主要蛋白酶進行結構分析得知此蛋白酶構型在結晶型態下是以相當緊實的二聚體(dimer)存在,且兩個蛋白分子彼此間朝特定方向相互垂直(11, 25)(圖11,PDB code:1UK4)。
圖11 SARS 冠狀病毒主要蛋白酶二聚體
The SARS-CoV Mpro dimer structure complexed with a substrate-analogue hexapeptidyl CMK inhibitor. The SARS-CoV Mpro dimer structure is presented as ribbons, and inhibitor molecules are shown as ball-and-stick models. Protomer A (the catalytically competent enzyme) is red, protomer B (the inactive enzyme) is blue, and the inhibitor molecules are yellow. The N-finger residues of protomer B are green. The molecular surface of the dimer is superimposed.
若以 SARS 冠狀病毒蛋白酶的結晶放大來探討,則可以發現在冠狀病毒主要蛋白酶的催化區域(catalytic site)上有三個重要的胺基酸,分別是半胱胺酸 145-組胺酸 41-半胱胺酸 85(Cys145-His41-Cys85)。此催化區負責受質(Substrates)水解的工作(圖12、13,PDB code:1UJ1)。
圖12 SARS CoV 3CLpro 單體放大圖及其蛋白水解位置
圖13 SARS CoV 3CLpro 單體放大圖及其活性空間位置
A schematic presentation of the conformational variations and altered hydrogen-bonding networks in active sites. The oxyanion hole of protomer A and N-finger of protomer B docked to its binding site.
然而這樣的催化區域中,其胺基酸於空間上的排列及其相對位置是否與其他型態的冠狀病毒相似,則必須藉由蛋白酶基因組序列的比較來得知。由於SARS蛋白酶屬於半胱胺酸蛋白酶家族(cysteine protease family),在過去亦有許多文獻報導了這一大類家族中,各種物種間的蛋白酶胺基酸序列(9, 17, 24, 26)。
以 R. Hilgenfeld 研究團隊發表的文獻為例(25),當中比對了 SARS 3CLpro 與演化樹裡第一型的豬傳染性腸胃炎病毒(TGEV)、貓傳染性腹膜炎病毒(FIPV)、人類冠狀病毒(HCoV)、與牛冠狀病毒(BCoV),第二型的鼠類肝炎病毒(MHV)以及第三型的家禽傳染性支氣管病毒(IBV)等各種正股 RNA 病毒的 3CL 蛋白酶後發現 HCoV 229E Mpro 與 TGEV Mpro 的結構相當類似,兩者之間的偏差相當的小。由於 HCoV 229E 和 TGEV 同為第一型冠狀病毒,因此他們的主要蛋白酶序列經過比較之後得知有 61% 相同。而將 SARS-CoV Mpro 與 HCoV 229E Mpro 及 TGEV Mpro 胺基酸序列相比,其一致性(identity)分別有 40% 和 44% 相同;若與第二型冠狀病毒的 MHV Mpro 與 BCoV Mpro 胺基酸序列相比較則分別有 50% 和 49% 相同;至於與第三型冠狀病毒之 IBV Mpro 相比,胺基酸序列則只有 39% 相同(8, 9, 25) (圖14)。
圖14 數種病毒之主要蛋白酶胺基酸序列比較圖
Structure-based sequence alignment of the main proteinases of coronaviruses from all three groups. HCoV, human coronavirus 229E (group I); TGEV, porcine transmissible gastroenteritis virus (group I); MHV, mouse hepatitis virus (group II); BCoV, bovine coronavirus (group II); SARS-CoV, SARS coronavirus (between groups II and III); IBV, avian infectious bronchitis virus (group III).
也由於 SARS 冠狀病毒的主要蛋白酶序列與豬傳染性腸胃炎病毒的蛋白酶序列相當類似,因此有許多的研究文獻就以這個相似性為出發點,藉著利用豬傳染性腸胃炎病毒蛋白酶的空間結構來設計與發展抑制SARS 冠狀病毒的抑制劑。
儘管 SARS 冠狀病毒在一些特徵上與第三型冠狀病毒相似,但由前述的比較得知其核酸序列與第二型冠狀病毒最為相符,因此雖然如前所述有一些研究將 SARS 冠狀病毒視為一種全新的第四型冠狀病毒,但是依舊有文獻認為可以將其歸類為第二型冠狀病毒(25, 27)(圖15)。
圖15 冠狀病毒演化樹圖形
Phylogenetic analysis of coronavirus replicase genes. SARS-CoV replicase ORF1b amino acid sequences (Entrez Genomes accession number NC_004718 (AY274119)) were compared with those from viruses representing the three coronavirus subgroups and the genus Torovirus. Group 1: transmissible gastroenteritis virus (TGEV), NC_002306; human coronavirus 229E (HCoV-229E), NC_002645; porcine epidemic diarrhea virus (PEDV), NC_003436. Group 2: mouse hepatitis virus A59 (MHV-A59), NC_001846; bovine coronavirus (BCoV-Lun) AF391542. Group 3: infectious bronchitis virus (IBV), strains Beaudette (NC_001451) and LX4 (AY223860). Torovirus: equine torovirus (EToV), X52374.
另一方面,由於先前亦有將冠狀病毒科(Coronaviridae)與另一種披膜病毒科(Togaviridae)中的 Arteriviruses 統一歸類至 Nidovirales order(Nidovirales目)內的報導(28),因此也有文獻一起比較了這兩種病毒家族中有關各式的不同,其中包含有蛋白酶的差異、親核性、受質水解專一性、蛋白折疊型態、RNA 原型蛋白酶與細胞原型蛋白酶等等不同之處。
冠狀病毒 3CLpro 屬於半胱胺酸蛋白酶,他具有類絲胺酸蛋白酶(serine proteinase,chymotrypsin-like)two-beta-barrel 摺疊的特性,但是他的催化特性是來自於一個成對(dyad)的 Cys-His 胺基酸而非原有的 Ser-His-Asp triad。由於冠狀病毒蛋白酶的催化區屬於胰凝乳蛋白酶(chymotrypsin),因此各種擁有胰凝乳蛋白酶的病毒,其對於受質在水解過程中的催化位置是否也具有相似性,這也是在探討冠狀病毒水解過程中的一個重要研究。
在這一類的病毒中除了胰凝乳蛋白酶本身之外,亦有人類 A 型肝炎病毒蛋白酶(Hepatitis A virus、HAV 3Cpro)、人類鼻病毒蛋白酶(Human rhinovirus、HRV 3Cpro)以及先前已經出現過的 TGEV 3CLpro 與 SARS 3CLpro 等。若將這些蛋白酶活性位點附近之關鍵殘基進行胺基酸序列比對,則可整理成表 2:
蛋白酶名稱 |
胺基酸序列
|
Chymotrypsin |
His57-Ser-195-Asp102
|
HAV 3Cpro
|
His44-Cys172-Asp84
|
HRV 3Cpro
|
His40-Cys147-Glu71
|
TGEV 3CLpro
|
His40-Cys144-Val84
|
SARS 3CLpro
|
His41-Cys145-Cys85
|
對於 chymotrypsin、HAV 3C 蛋白酶與 HRV 3C 蛋白酶來說,其活性部位包括三個關鍵殘基:His、Ser/Cys與 Asp/Glu。而對於 TGEV 與 SARS 的 3C-like 蛋白酶來說,活性部位則只有兩個殘基:His 與 Cys。在相對應應該出現 Asp 的地方,則是由 Val 和 Cys 所佔據,而且側鏈是偏離活性中心的。但是從 TGEV 3CL 蛋白酶的晶體結構中可以發現活性中心裡還有一個水分子,且和周圍的 Asp186、His41 及 His163 等三個胺基酸殘基形成氫鍵。因此這個水分子可能扮演和 Asp 相似的功能。
若以進行蛋白水解程序的角度來進一步的分析各種冠狀病毒對於受質的水解切割位置,過去有文獻報導了利用多序列比對(multiple alignment)的方法可以發現於受質的自發性切位點(auto-cleavage site)幾乎都有特定的胺基酸扮演著旗標的角色(29)(表3)。
而如果將冠狀病毒對於受質水解位置利用統計方法將相似性歸納比較之後,則可以整理成圖 16(17)。
圖16 冠狀病毒主要蛋白酶受質專一性
Two separate multiple, gap-free 18-aa-long alignments including the P9–P9’ positions of the sites (presumably) cleaved by the 3CLpro domains of six coronaviruses (transmissible gastroenteritis virus, NC_002306; HCoV-229E; porcine epidemic diarrhoea virus, NC_003436; mouse hepatitis virus A59, NC_001846; bovine coronavirus, AF391542; IBV-B) and SARS-CoV were converted into two sequence logo(34) presentations. The height of the entire stack is proportional to the information at this position which is measured in bits, with the upper limit of information at any position being equal to 4?32 bits. Amino acid residues are colored in the following groups: light-green – S, T,C; orange – N,Q; red – D, E; blue – K, R, H; brown – W, F, Y; black – A, L, I, V, M; pink – P; green – G.
分析比較受質被水解的胺基酸序列之後可以得到一個小結論:在 P1 位置都是被麩醯胺酸(Gln,Q)所佔據,P2 位置則以一個較疏水性的亮胺酸(Leu,L)填充較佳,至於 P1’位置偏好丙胺酸(Ala,A)與絲胺酸(Ser,S)兩個胺基酸。
因此如何合成一個適當的抑制劑來取代原有的自然受質(origin substrate),同時符合自然受質本身的結構特性使得 SARS 冠狀病毒蛋白酶與抑制劑發生反應,進而抑制其對於原受質的水解程序之發生,則可以達到抑制 SARS 冠狀病毒活性的目的。
參考資料:
17. Thiel, V.; Ivanov, K. A.; Putics, Á.; Hertzig, T.; Schelle, B.; Bayer, S.; Weißbrich, B.; Snijder, E. J.; Rabenau, H.; Doerr, H. W.; Gorbalenya, A. E.; Ziebuhr, J. J Gene Virol. 2003, 84, 2305-2315.
24. Anand, K.; Palm, G. J.; Mesters, J. R.; Siddell, S. G.; Ziebuhr, J.; Hilgenfeld, R. EMBO J. 2002, 21, 3213-3224.
25. Anand, K.; Ziebuhr, J.; Wadhwani, P.; Mesters, J. R.; Hilgenfeld, R. Science, 2003, 300, 1763-1767.
26. He, J.-F.; Peng, G.-W.; Min, J.; Yu, D.-W.; Liang, W.-J.; Zhang, S.-Y.; Xu, R.-H.; Virology group: Zheng, H.-Y.; Wu, X.-W.; Xu, J.; Wang, Z.-H.; Fang, L.; Zhang, X.; Li, H.; Yan, X.-G.; Lu, J.-H.; Hu, Z.-H.; Huang, J.-C.; Wan, Z.-Y.; Hou, J.-L.; Lin, J.-Y.; Molecular biology group: Song, H.-D.; Wang, S.-Y.; Zhou, X.-J.; Zhang, G.-W.; Gu, B.-W.; Zheng, H.-J.; Zhang, X.-L.; He, M.; Zheng, K.; Wang, B.-F.; Fu, G.; Wang, X.-N.; Chen, S.-J.; Chen, Z.; Data analysis group: Hao, P.; Tang, H.; Ren, S.-X.; Zhong, Y.; Guo, Z.-M.; Liu, Q.; Miao, Y.-G.; Kong, X.-Y.; He, W.-Z.; Li, Y.-X.; Wu, C.-I.; Zhao, G.-P.; Chinese University of Hong Kong group: Chiu, R. W. K.; Chim, S. S. C.; Tong, Y.-K.; Chan, P. K. S.; Tam, J. S.; Lo, Y. M. D. Science. 2004, 303, 1666-1669.
27. Snijder, E. J.; Bredenbeek, P. J.; Dobbe, J. C.; Thiel, V.; Ziebuhr, J.; Poon, L. L. M.; Guan, Y.; Rozanov, M.; Spaan, W. J. M.; Gorbalenya, A. E. J. Mol, Biol. 2003, 331, 991-1004.
28. Cavanagh, D. Archiv Virol. 1997, 142, 629-633.
29. Hegyi, A.; Ziebuhr, J. J. Gene virol. 2002, 83, 595-599.
34. Schneider, TD.; Stephens, RM. Nucleic Acids Res. 1990, 18, 6097-6100.