2024年5月13日发(作者:diamond)
44
微生物学杂
志
2020
年
12
月第
44
卷第
2
期
JOURNAL
OF
MICROBILLOGY
Dee.
2020
Vol,
44
No.
6
新型冠状病毒
3C
样蛋白酶结构和功能特征分析
戴姿薇
,
唐标
*
*
(湖南中医药大学医学院
,湖南长沙
412208
)
摘
要
采用生物信息学方法分析新型冠状病毒
(
Severe
aceto
respiratoy
syad
rome
coronavirus
2
,
SARS-FoV-
2)3C
样蛋白酶
(
3-chymotypsin-Fke
protease
,
307")
的理化性质
、
结构与功能
,
为抗
SARS-FoV-5
药物研发提供
参考
。
通过
ProtParam
、
ProtUcaW
、
BioeVit
服务器对
3CL2
ic
进行一级结构如氨基酸理化性质
、
疏水性的预测分析
;
COILS
Server
、
SignaW
、
TMPreP
、
TargetP
Server
、
NetPhos
Server
、
NetNGWc
Server
服务器对
3
C
l
2
"
1
结构进行如卷曲
螺旋区
、
信号肽
、
跨膜结构域
、
亚细胞定位
、
磷酸化位点
、
糖基化位点的预测分析
;
sopma
SWISS-MODEL
服务
器对
3
cl
210
进行二级结构
、
三级结构的预测分析
;
IEBD
对
3
cl
210
进行
B
细胞表位的预测分析
。
3CL
uic
由
306
个
、
氨基酸组成
,
其中亮氨酸占比最高
,分子质量为
33
776.64
,
理论等电点值为
5.65
,
半衰期为
1.6
h
,
脂肪系数为
82.32
;
亲水性较高
,不具有卷曲螺旋区与信号肽特点
,
含一个跨膜区
;
具有
4
个磷酸化位点
,
2
个糖基化修饰
点
;
二级结构中无规则卷曲占据主导地位
,
三级结构能与已知的
2yPa.3(SMTL
ID)
模型同源建模;存在
4
个潜
在的
B
细胞表位
,
位于
02
-
141
位的氨基酸区域应答频率最高。
利用生物信息学技术分析
3CL
210
的结构和功
能特征
,
可为新型冠状肺炎药物的研发提供参考
。
关键词
新型冠状病毒
(
SARS-doV-2
)
;
3
CLte
;
生物信息学;序列分析;蛋白结构
中图分类号
Q039.63
文献标识码
A
文章编号
1005
-
702
1(2020
)06
-
0044
-
09
Poi
:
U.3969/j.
issn.
1405
-
7021.6020.46.407
Structuroi
and
Functionai
Charocteristics
Analysis
of
SARS-CoV-2
3CL
prr
vio
Bioinformaticc
DAI
Zi-wel
,
TANG
Biav
(Med.
Schi
,
Huaao
U
oc
of
ChUtesc
Mei
,
Changsha
412208)
Abstrrct
In
this
swUp,
physicochemical
propeDies,
structure
and
function
of
3-chymotypsin-dae
protease
(C
—
)
were
preVicwV
via
bioihormatics
,
to
provide
references
for
R&
Dof
anP-SARS-CoV-2
meVicines.
Bp
preVicting
and
analyzing the
primay
structure
ol
3C
—
TO
such
as
physicochemical
propeDics
ol
amino
acids,
hyProphoXic
chaycteDs-
Pcs
preViction
analysis
in
terms
ol
theoyPcal
isoelectric
point,
half-Ffc
periob
,
fat
0
(
/
伍
:
60
and
hyPyphoXic
chayc-
teVstics
ol
3CLP"
on
ProtParam
,
Prothcalo
and
BioeVit;
the
structure
such
as
cor/ng
spiral
reaion
on
the
COILS
Serv
er,
signal
pepPPes
on
the
SignalW
,
Nansmembranc
domain
via
TMPreV
,
subcellular
location
on
TarpetP
Server,
phos-
phoyWtion
sites
and
glycosylation
sites
ol
3C
—
TO
on
NetPhos
Server
and
NetNGlpe
Server
;
the
seconday
structure
on
the
SOPMA
,
the
ter/ay
structure
ol
3CL
2y
on
the
SWISS-MODEL
,
the
B
cell
epitopes
ol
3CL
2y
on
the
IEBD
to
reai-
iec
3(2
—
.
3CLP"
consists
ol
326
amino
acids
;
among
them
leacinc
accounts
for
the
highest
propor/on
,
moWcoWr
weight
was
33
776.
64
,
theoyPcaWsoeWctVc
point
5.95
,
haW-Ffe
peVob
1.9
hours
,
fat
0
(
0
伍
:
60
82.
12
;
with
rela
tively
high
hyPyphiWcitp
,
containing
1
Nansmembranc
zone,
possessing
4
phosphoyWtWn
sites,
2
glycosylation
moPi-
fication
sites
;
no
chaycteVstic
ol
coileV
spiral
reaion
and
signal
pepPPe
;
random
coilc
dominate
in
seconday
sNuc-
基金项目
:
2219
年湖南省教育厅科学研究项目优秀青年项目
(
12B536
)
;
湖南中医药大学
“
十三五
”
一级学科基础医学建设
项目
(
No.
06
)
作者简介:戴姿薇女
,
本科生
o
主要研究方向为免疫学基础研究o
:
U90129594@qq•
cm
*
通讯作者
o
男
,
博士
,硕士生导师
o
主要研究方向为免疫学基础研究
o
Tel
:
9751-C8457291
,
E-mail:
njtangbiao@
122.
10m
收稿日期
:
2929W6W8
6
期
戴姿薇等:新型冠状病毒
3C
样蛋白酶结构和功能特征分析
turo
,
the
te/iae
structure
can
be
homologops
with
koowu
6yp5.
1
(
SMTL
IU
)
moPei
;
existing
4
potexOui
B
celt
epitopes,
with
the
h/hest
espoxse
freyuexcy
ic
amiue
acid
areas
at
92-41.
By
aPopOng
bioinformatics
techuology
anapsis
ox
the
structure
and
fuuctiox
of
30°
coulP
provide
efeexces
for
R&
D
of
SARS-CoV2
mediciuc.
45
Keywords
Severe
acoto
espietoe
syndrome
coroxavirus
2
(
SARS-CoV2
)
;
3
O°
;
bioinformatics
;
sequexcing
;
proteic
structure
2222
年上半年
,
由新型冠状病毒
(
Severe
uchiv
espiwtoe
syndema
coennviws
2
,
SARS-
要为洛皮纳韦和利托那韦
,
研究证实两者通过抑
制
CEP_C32
的功能可阻止
SARS-CoV-2
复制周期
CoV-4
)
引起的新型冠状病毒肺炎
(
Coexo
Virus
Disensa
224
,
COVIU-4
)
以数月时间在全世界引
的进行
,
以往分子动力学模拟分析也表明两者与
SARS-C
o
V-3CL
2W
复合物结合亲和力相等,且在药
起了大流行,对全球居民健康构成了严重威胁。
SARS-CoV-2
是基因组为单股正链
RNA
且隶属于
0
冠状病毒组的新型冠状病毒类型
,
其结构蛋白
主要由刺突蛋白
(
Spike
Protein
,
S
蛋白)
、
包膜糖
蛋白
、
膜糖蛋白
、
核衣壳蛋白组成
。
在
SARS-CoV-
2
入侵宿主时
,
表面
S
蛋白被跨膜丝氨酸蛋白酶
2
(transmembrane
peteasa
se/nes
,
TMPRSS2
)
剪切为
S1
亚基与
S2
亚基
,
S1
亚基的受体结合区与宿主
细胞表面血管紧张素转换酶
2
(
Anomtepsid-Con-
ve/ing
Enzyma
2,ACE2)
受体结合引起
S2
亚基构
象变化
,
形成病毒与细胞膜融合物
,
从而释放病毒
基因组至宿主细胞质中°此后病毒便利用宿主胞
内物质合成自身复制所必需的两条复制酶多肽
ppln
和
pplab
,
同时也开始编码能精确剪切复制
酶多肽的剪切酶:木瓜蛋白酶样蛋白酶
(
papaic-
lidv
protensa
,
PL
pw
)
和
3C
样蛋白酶
(
3-chymote2-
sin-CUa
petensa
,
3CL
pe
)°
PLpra
和
3CL
pw
剪切
ppln
和
pplab
生成
4
个成熟非结构蛋白,非结构
蛋白参与
RNA
复制酶-转录酶复合物
(
rey/case-
transc/ptasa
complex
,
RTC
)
的形成
,
RTC
形成后
指导
RNA
复制和亚基因组
RNA
的转录
,
转录成
功后,
子代基因组与病毒结构蛋白组装为成熟的
子代病毒
,
经胞吐作用释放后感染更多新的细
胞
[
2
]
°已有研究揭示
3CL
pe
是由两个彼此近似
垂直排列的单体组成的二聚体
,
每个单体包含三
个结构域
:
由
0
桶状结构组成的结构域
I
与结构
域
I
,
由
a
螺旋结构组成的结构域
皿
。
其中
,
两个
单体的
N
端通过与另一个单体上的
G1U126位点
相互作用来帮助定位底物结合位点
S1
亚基
。
目
前在
3CL
pe
氨基酸序列公布后
,
较多研究从已有
序列信息结合其结构特点的角度筛选药物靶点
:
针对
3CL
pe
进行临床试验的蛋白酶类抑制药物主
物与复合物形成后分别可检测到
6
个与
7
个氢
键;槲皮素作为一种中药类药物在毕赤酵母中对
SARS-C
o
V-3CL
2W
复合物表达的抑制率可达
62%
,
体外酶实验中也表现出对复合物的抑制活性
3
2
]
。
3CL
pe
在病毒的复制中发挥了重要作用
,
抑制
3CL
pe
功能能阻断
SARS-CoV-4
在宿主体内的复
制
,3CL
2W
成为了抗
SARS-CoV-4
药物的重要潜在
靶点
,
但
3CL
pe
的结构和功能特征还有待进一步
阐明
。
本研究结合生物信息学方法
,
通过利用
PetParam
、
ProtUcaiv
;
Bioedii
服务器对
3
CL
20
进行
一级结构如氨基酸理化性质
、
疏水性的预测分析;
利用
COILS
Seear
SipnalU
TMPred
TaryetU
See-
er
、
NetPOvs
Server
、
NetUGlye
Seear
服务器对
3CL
pe
功能结构如卷曲螺旋区
、
信号肽
、
跨膜结构
域
、
亚细胞定位
、
磷酸化位点
、
糖基化位点的预测
分析
;
利用
SOPMA
、
SWISS-MODEL
服务器对
3CL
pe
进行二级结构
、
三级结构的预测分析;利用
IUBD
对
3CL
pe
进行
B
细胞表位的预测分析
,
为基
于
3CL
po
的抗
SARS-CoV-4
药物研发提供参考
。
1
材料与方法
1
1
材料
1-1-1
数据来源
登录美国国家生物信息中心
NCBU
网站
(
NCBI
网址
:
http
:
/
/www.
ncbl.
nlm.
nib.
gav/)
获取
SARS-CoV-4
3CL
pe
氨基酸序列信
息
,
并下载其氨基酸
FASTA
序列
(
PDB
ID
:
6LU7
°
1.1.2
主要数据库
通过
PetParam
预测分析
3CL
pe
等电点
、
半衰期
、
脂肪系数等理化性质
;
通过
PetUcaiv
和
Bioedii
双重预测分析
3CL
po
疏水性;
通过
CODS
Seear
预测分析
3CL
pe
卷曲螺旋区;通
过
SiynalU
预测分析
3CL
po
信号肽
;
通过
TMPed
46
微生物学杂志
44
卷
预测分析
3CLpo
跨膜结构域
;
通过
TaryetP
Seear
预测分析
3CL
po
亚细胞定位
;
通过
NetPOvs
Seear
预测分析
3CL
po
磷酸化位点;通过
NetOGlne
Seear
网页输入
3CL
2O
FASTA
格式的氨基酸序列
,
选择
"4
(
Heliv
-
Sheet
,
Tuo
,
Coil
)
”
选项
,
Simila/tp
tOeskolP
填入
“
8
”
,
点击
“
SUBMIL
”
输出
,
呈现
预测分析
3CL
pe
糖基化位点
;
通过
SOPMA
预测分
析3CL
po
二级结构;通过
SWISS-MODEL
同源建模
3CL
ue
二级结构预测结果
;
于
SWISS-MODEL网页
上输入
3CL
hO
FASTA
格式的氨基酸序列后选择
3CL
pe
三级结构
;
通过
ILBD
预测分析
3CL
2O
B
细
“
Bu/d
ModeP'
选项同源建模
,
选择相似度最高模
型输出
,
呈现
3CL
ue
三级结构预测结果
[422
]
°
胞表位°
1-2
方法
1.2.2
3CL
ue
B
细胞抗原预测分析
通过
ILBD
1.2.1
3CL
pe
—
级结构预测分析
通过
Pei-
网页选择
"B
Celt
Ep/opo
Prediction
后点击
"Pe-
Param
网页输入
3CL
pe
FASTA
格式的氨基酸序
列
,
点击
“
Compuia
parameters
)
运行结果
,
呈现
3CL
pe
氨基酸数量
、
分子质量
、
理论等电点
、
正负电
荷残基总数
、
分子式
、
原子总数
、
脂肪系数
、
总平均
亲水性等理化性质结果;通过
PetUcaiv
网页上输
入
3CL
pe
FASTA
格式的氨基酸序列
,
选择
"Hphob./Kyte
&
DooXt
P
e"
方法和
"Unea/'
权重变
化模型
,
点击
“
SuUmF
”
运行结果
,
呈现
3CL
pe
疏水
性预测结果
;
同时运行
Bioedk
软件
,
导入序列后
点击
"
Sequence-Protein
"
,
选择"
Kyiv
&
Doolittiv
Menn
HydephoPicby
Profile
方法
,
双重预测
3CL
po
疏水性结果
3
20
°
1.2.2
3
CL
20
结构预测分析
通过
CODS
Seear
网页选择默认矩阵
MTIDK
,
分别赋予无权重与有
权重选项
,
输入
3CL
2W
FASTA
格式的氨基酸序列
,
呈现
3CL
pe
卷曲螺旋区预测结果;通过
SiynalU
网
页上选择
"EiipFyotvs
”
训练集
,
D-cotofO
valuvs
选
择
"DOaUP'
默认值
,
MohoP
选择
"Dipui
sepuexcas
mup
incluUv
TM
reyions
',
以
"
standarU
'
模式输出
,
呈现
3CL
2e
信号肽预测结果;通过
TMPred
网页上
选择
17
〜
33
个氨基酸作为跨膜螺旋疏水部分长
度后输入
3CL
2e
FASTA
格式的氨基酸序列
,
随即
点击
“
Run
TMPed
”
输出
,
呈现
3CL
2e
跨膜结构域
预测结果
;
通过
TaryetP
Seear
网页上选择
“
non-
pUFn
”
的生物类别
,
以
“
Lonp
0
x
00
)
”
形式输出
,
呈
现
3CL
ue
亚细胞定位预测结果;通过
NetPOvs
See-
01
■网页上选择
“
Ft
thev
”
的预测范围和
“
basic
”
的输出形式,勾选生成图形
,
呈现
3CL
hO
磷酸化位
点预测结果
;
通过
NoNGlyc
Seear
网页上输入
3CL
uro
FASTA
格式的氨基酸序列
,
选择
“
Gooaio
yophics
”
,
点击
“
SuUmii
'
输出
,
呈现
3CL
pc
糖基化
位点预测结果
[
125
]
°
1.2.3
3CL
hO
高级结构预测分析通过
SOPMA
dictiop
of
Unenr
eyimpos
from
protein
s
—
uoco
”
输
入
3CL
ue
FASTA
格式的氨基酸序列
,
选择
u
Bepipred
Lineor
Epitopo
Prediction
”
模式输出
,
呈
现
3CL
2O
B
细胞表位预测结果
[
2
]
°
2
结果与分析
2.
1
3CL
"
。
氨基酸理化性质特性分析
利用
PetParam
服务器在线分析
3CL
hO
氨基
酸理化性质
,
结果如表
1
所示
。
3CL
hO
由
306
个氨
基酸组成
,
其中亮氨酸
(
Leu
)
占比最高
,
其次为甘
氨酸
(
Gly
)
,
没有毗咯赖氨酸
(
Pyi
)
和硒代胱氨酸
(
Sac-
;相对分子质量为
33
796.64,
理论等电点值
为
5.05
;
正电荷残基数为
22
个
,
负电荷残基数为
26
个;半衰期为
1.0
0
不稳定系数为
27.65
;
脂肪
系数为
62.
4
°
表
1
3CL
”
r
氨基酸理化性质部分分析结果
TaOic
1
Part
of
5CL^
physicochemical
properties
analysis
resulis
理化性质
数值
氨基酸数目
306
分子质量
33796264
等电点
5295
负电荷残基数
(
天冬氨酸
+
谷氨酸
)
24
正电荷残基数
(
精氨酸
+
赖氨酸
)
22
分子式
C
1499
H
2317
N
455
S
22
原子数目4686
脂肪系数
82.
12
氨基酸亲水值总和与氨基酸数量比值
-0.04
2.2
3CL
"
。
氨基酸序列的疏水性分析
蛋白质肽链中残基侧链对溶剂的相对亲水性
是一个重要的蛋白质特征参量
,
且疏水性的变化
规律对维系蛋白质超二级结构与三级结构有一定
的意义
。
利用
Pethcyiv
服务器在线分析
3CL
hO
氨
基酸疏水性
,
结果如图
1
所示
。
其中评分最高的
2
期
戴姿薇等:新型冠状病毒
3C
样蛋白酶结构和功能特征分析
47
为位于第
226
位的丙氨酸和第
207
位的色氨酸,
集中于蛋白质的卷曲结构部位
,
其表面通常富集
均为
1.823,
表明该位点的氨基酸疏水性最强
;
评
分最低的为位于
96
位的脯氨酸
,
为
-1.731,
表明
亲水性氨基酸
,
同时也是蛋白质进化过程中氨基
酸插入的主要位点
。
以上结果表明,
31-
2/亲水性
该位点的氨基酸亲水性最强
。
亲水性区域一般是
较高,且利用
BioEdil
双重预测
,
结果一致
(
图
2
)
。
图1
PrrtScad
预测
3CL
prr
疏水性
Fig.
1
HyProppobic
chaycteDsUcr
analysis
results
of
9CL^
via
Proghai
2.3
3CL
prr
卷曲螺旋区分析
研究在有权重和无权重的情况下进行分析得知,
卷曲螺旋是存在于多种天然蛋白质中一类由
2
股或
2
股以上右手
a
螺旋相互缠绕而形成的平
31-
2
「
/
并未预测到具有卷曲螺旋结构
。
2.4
3CL
pro
信号肽分析
行或反平行左手超螺旋结构的总称
。
利用
coil
Seter
服务器在线预测
30/
「
。
卷曲螺旋结构
。本
信号肽是指引导新合成的蛋白质向分泌通路
转移的短肽肽链
,
位于分泌蛋白的
N
端
。其由三
48
微生物学杂志
40
卷
个区组成:一个为带负电荷的
C末端
,
一个为以中
低
,
因此
3CL"
。
可能不具有信号肽的特点
。
2.3
3CL
po跨膜结构域分析
性氨基酸为主的中间疏水序列
,
一个为带正电的
n
末端
。
中间疏水序列为信号肽的主要功能区,
C
末
跨膜结构域一般由跨膜蛋白组成的效应区域
端为信号序列的加工区
。
利用
SignalW
服务器在线
所展现,
跨膜蛋白即跨越膜两端的蛋白质
,跨膜部
预测
31-
2/
信号肽区段
,
结果如图
3
所示
。
图
3
中
C
分值是指剪切位点分值,
S
分值表示信号肽分
分形成的
a
螺旋或
0
桶结构对认识蛋白质在细
胞中的定位与作用具有指示意义
。
利用
TMPyV
值,
Y
分值表示综合剪切点分值
。
本次预测结果显
预测
3CL
yy
跨膜结构域
,
得出其有
1
个跨膜螺旋
区
,
其位置在
163
~211
位
,
结果如图
7
所示
。
分
分
分
阈
j
g
n
j
示
^
CL
10
信号肽预测得分较低
,
剪切位点得分也较
位置
图
3
SignalP
预测3CL
pr
信号肽
Fig.
3
Signal
pevtide
analysis
resulp
of
3CL
21D
vio
SignalW
图
4
TMPreC
预测
3CL
prr跨膜结构域
Fig.
4
Trapsmembraac
Pomaia
analysis
results
of
3(2
—
°
via
SignalW
2
期
戴姿薇等:新型冠状病毒
3C
样蛋白酶结构和功能特征分析
49
2.6
3CL"°
亚细胞定位分析
氨酸
)
的过程
,
是一种体内调节蛋白质功能和参
与细胞信号转导的基本机制
。
利用
NetPh/s
Sey-
亚细胞定位是指某种蛋白或其产物在细胞内
的具体位置
,
由于蛋白质表面直接暴露于细胞器
环境中
,
它由序列折叠过程决定
,
而后者取决于氨
基酸组成
。
利用
TarpetP
Seyer
服务器在线预测
vr
服务器在线预测
3CL
yy
的磷酸化位点
,
结果如
图
5
所示
。
分析其可能的
1
个丝氨酸磷酸化位点
为
18,
,
个苏氨酸磷酸化位点为
7,2
个酪氨酸磷
3CL
he
亚细胞定位
,
结果如表
2
所示
。
该序列指向
定位于线粒体分值为
2.
160
,
指向具有分泌途径
酸化位点为
4
和
23
,
以超过阈值
2.
3
判定为潜
在的磷酸化位点
。
表
2
TargetP
Servvr
预测
3CL
prr
亚细胞定位
Tanie
0
SuUcellulas
locatiou
analysis
resulp
of
3CL
2y
vio
TargetP
Seyes
名称
即存在信号肽可能性的分值为
0.117
,
可靠性等
级为
3
,
因此推测其序列不是定位于线粒体
,
无信
号肽
。
2.3
3CL
"
。
磷酸化位点分析
定位于线粒体
2.190
定位于信号肽
2.117
22222
定位于其他
蛋白质磷酸化是指蛋白质激酶将磷酸基团转
序列分析得分
量值
22615
22222
移到底物蛋白质氨基酸残基
(
丝氨酸
、
苏氨酸
、
酪
22222
丝
氨酸
苏
氨酸
酪
氨酸
阈
值
赳
2.3
3CL
pr
糖基化位点分析
蛋白质糖基化是指在糖基转移酶作用下将
糖转移到蛋白质并与其氨基酸残基形成糖苷键
的过程
,
对蛋白质具有重要的修饰与调节作用
。
0
0
50
100
150
200
250
300
位置
图
5
NetPhot
Servvr
预测
3CL
prr
磷酸化位点
Fig.
5
Phosyhoylatiou
sites analysis
results
of
9CL^
via
NetPhos
Seyes
利用
NetNGWc
Seyar
服务器在线预测
31-
2/
的
糖基化位点
,结果如图
2
所示
。
以
2.2
为阈值
得出位于
133
位点与
142
位点有可能发生糖基
化修饰
。
阈值一
潜力
_
1.00
0.75
0.50
0.25
0
50
100
150
位置
200250
300
图
P
N
et
NG
tyc
Server
预测
3C
L
p
:
糖基化位点
Fig.
9
GlydsylatNu
sites
analysis
results
of
9C
—
via
NetNGlpe
Serves
50
微生物学杂志
44
卷
2.9
3CL
"
。
二级结构分析
酸残基侧链
。
利用
SOPMA
服务器在线预测
3CL
ue
蛋白质二级结构是指其主链骨架原子沿一定
的二级结构
,
结果如图
7
所示
。
a-
螺旋结构占比
22.06%
;
0
2
折叠结构占比
27.
12%,
0
-
转角结构占
的轨迹盘旋或折叠成特定的构象,主要形式包括
a
螺旋
、
0
-
折叠
、
0
-转角和无规卷曲,并不涉及氨基
Him
比
11.24%
,
无规则卷曲结构占比
32.
37%
°
Ill'll
hi
||||||||
50
hi
100
150
200
250
Ji
50
100
150
200
250
图
7
SOPMA
预测
3CL
prr
二级结构
Fig.
4
Secondae
structure
prediction
of
50°
via
SOPMA
2.10
3CL
pr
三级结构分析
评分为
0.49
,
说明模型质量较好
;
QMEAN
评分为
0.45,
说明
3CLhO
与模板蛋白匹配度较高
。
匹配
预测的寡聚态
(
OUpome/c
statu
)
为
Hamv-dimee
蛋白质三级结构是指蛋白质在二级结构的基
础上通过侧链基团相互作用进一步卷曲折叠
,
依
靠分子内和分子间作用力维系形成的特定空间结
2.
11
3CL
prr
B
细胞表位预测
B
细胞表位是指易于接近并被
B
细胞受体和
构
。
利用
SWISS-MODEL
服务器在线预测
3CL
hO
的三级结构
,3CL
ue
蛋白酶的
1
~321
位氨基酸与
序列相似度为
40%
的
6y2y.
1
(
SMTL
ID
)
能够进
行同源建模
,
建模结果如图
6
所示
。
模型
GMQE
抗体分子识别
,
由
3
~
5
个在空间中连续或不连续
氨基酸组成的亲水性氨基酸区域
。
利用
IEBD
服
务器在线预测
3CL
hO
的
B
细胞表位
,
结果如图
9
所示
。
得分最高的为位于
92
~
101
位的氨基酸,
分数为
2.422
;
其次为
156
-
49
位的氨基酸
、
119
~45
位的氨基酸
~
156
位的氨基酸
,
以
0.352
为阈值判定结果
。
3
讨
论
本研究采用生物信息学的分析方法对
3CL
ue
氨基酸的理化性质
、
疏水性
、
卷曲螺旋区
、
信号肽
跨膜结构域
、
亚细胞定位
、
磷酸化位点
、
糖基化位
点
、
二级结构
、
三级结构
、
B
细胞表位进行了预测
与分析°
从其理化性质预测结果来看
,3CL
ue
全长
325
个氨基酸
,
亮氨酸占比最高,理论等电点为
5.95,
图
8
SWISS-MODEL
同源建模
3CL
prr
三级结构
Fig.
3
Te/iag
stocturo
prediction
of
5CL
uw
via SWISS-MODEL
有较高的亲水性
。
研究表明在冠状病毒
3CL
hO
的
水解位点上,
P1
位偏好谷氨酰胺
,P2
、
P3
、
P4
位分
别偏好亮氨酸
、
碱性残基和小疏水残基,
P32
位并
2
期
戴姿薇等:新型冠状病毒
3C
样蛋白酶结构和功能特征分析
51
未表现出强烈偏好
[
11
]
,
冠状病毒入侵宿主的过程
和功能区域提供构象支持
。
从其三级结构预测结果来看
,
三级结构同源
也是一种依赖
pH
环境和受体内吞介导的入侵方
式
,
这与其特定的理化性质相关
。
因此
31-
2/
理
化性质的阐明有利于对了解病毒入侵中
31-
2/
发
建模显示其配体为
1GLY
与
2xO6K
。
31-
2/
三级
结构中
N-
端部分氨基酸对其二聚化和活性位点
的形成具有重要作用
,
同时位于结构域
I
与
n
间
挥水解剪切的具体作用机制提供帮助
。
从其信号肽与跨膜区预测结果来看
,31-
2/
属
于非分泌蛋白
,
因此无需考虑该蛋白外泌问
题
「
1
]
。
从其磷酸化位点与糖基化位点预测结果
的氨基酸残基区域构成了底物的结合位点
,
针对
31-
2/
二聚化的肽基抑制剂组合设计成为了一种
潜在的治疗策略
。
有文献指出
[01
]
,通过建立配
体-蛋白质相互作用网络可得出
SARS-FoV
和
SARS-FoV-S
31-
2/
中的配体结合极为相似
,
并发
来看
,30/
「
。
具有明确的上述位点
,
推测其可能具
有较高的生物活性
。蛋白质在翻译后形成成熟蛋
白质的过程中通常需要适当修饰,磷酸化与糖基
化被认为是自然界最为重要的翻译后修饰形
式
[
20
]
o
现最有效的对接配体与芳香基团具有共同的结合
模式
—
—
通过可旋转键以假线性形式连接
,
并得
出结合能负值较大的生物碱和萜类化合物与
从其二级结构预测结果来看,
a
螺旋与
0
-折
叠化学键能较高
,
作为中心支架较难与抗体嵌合,
31-
2/
亲和力较高
,
这种结合可能是通过活性残基
的硫酸盐阴离子的共价改变实现的
,
因此提示
30/
「
。
配体结构和同源建模其三级结构为阻断
SARS-FoV-2
与
ACE2
受体结合后发挥生理功能
与疫苗药物研究提供了潜在靶点
。
此外,抗原优
但其占比也较高
,
提示
30/
0
具有一定程度的稳
定性
,
可为筛选蛋白提供靶点提供帮助
;
而
31-
2/
二级结构中占主导地位的无规则卷曲结构则常位
于分子表面
,
相比之下更利于与抗体结合
,
其虽为
无法被归入明确二级结构的多肽片段
,
但其具有
一定的结构且受侧链相互作用影响
,
因此推测此
势表位是临床应用与疫苗研制的重要依据
。
目前
广泛运用的抗原表位鉴定方法通常为通过预测蛋
白质抗原优势表位后通过体外合成进行验证其可
类占比
32.
35%
的非重复性无规则卷曲结构有可
能会有效促进机体产生免疫反应并为
31-
2/
活性
靠性
。
本研究发现了四个可能性较高的表位区
域
,
说明
30/
「
。
可能具有较好的抗原性
。
除此之
52
微生物学杂志
44
卷
外,疫苗肽的研制还需要
3CL
hO
免疫原性细胞毒
性
T
细胞和辅助
T
细胞等信息
,
因此进一步确认
3
CL
ue
抗原表位细节更有利于疫苗靶点的确定
。
man
Hergesvirus
8
virai
EN/euUin-6
with
human
inNOeuUin-6
oceptor
using
in
si/cc
approach
:
The
Potextiai
Roie
in
HHV-C
Pathogenesis
[
J
].
Currexi
Proteomics
:
2624
,
17
(
2
)
:
197
119.
目前人们在病毒学
、
流行病学
、
临床试验方面
[9
]
LiuO
C
,
Guanghua
J
,
Lei
BO
,
—
aP
Cloning
and
sequeyce
analysis
of
T-psy1
gene
from
Ope-cyed
todacce
[
J]
.
Tobacco
Science
&
Technology,
2617
,56(8)
:
12.
对
SARS-CoV-4
逐步有了更多的认识
。
然而
,
由
于缺乏足够的理论依据
,
尚未有正式批准使用的
[
6
]
刘威
,
付玉荣
,
伊正君.结核分枝杆菌
PKnG蛋白结构与
功能的生物信息学分析
[]
.中国病原生物学杂志
,
2613
,
抗
SARS-CoV-4
病毒的药物和疫苗
,
因此新型冠
状病毒肺炎的治疗在现阶段主要依靠临床医生治
15(5)
:
507271.
疗经验进行
。
当前已有研究结合中国上海科技大
[
1
]
王宇
,
祁晶晶
,
刘婷
,
等
.
滑液支原体醛缩酶的亚细胞定
学课题组测定发表的
3CL
ue
高分率晶体结构预测
药物靶点
,
大多从建立分子模型进行药物对接虚
拟筛查的角度理解
3CL
ue
的功能机制
,
如利用对
应数据库进行不同抑制剂的结合亲和力对接计算
后聚类排序再观察其之间的分子相互作用
3225]
,
但对于
3CL
hO
基础理化性质与功能结构如疏水
性
、
卷曲螺旋区
、
信号肽
、
跨膜结构域
、
亚细胞定
位
、
磷酸化位点
、
糖基化位点等详细阐述较少
。
因
此本文结合生物信息学方法较全面地分析
3CL
hO
功能与结构特征
,
为抗
SARS-CoV-4
药物的相关
研究提供参考°
参考文献
:
[]
沈媚
,
陈冰清
,
于瑞嵩
,
等
.
冠状病毒
s
蛋白及其受体的
结构和功能
[J].
微生物学通报
,
2617,24(19
)
:
2452-2762.
[2
]
ParU
JY
,
YuU
HJ
,
Ryn
HW,
et
aP
Evaluation
of
pdyphends
from
Broussonetia
papyOmra
as
coronavios
protease
indibitow
[
J
].
Jouwai
of
Enzyme
Indibi/on
&
Medicinai
Chemisto
,
2617,
32(1)
:
364212.
[3
]
Xu
X
,
Chen
P
,
Wang
J,
et
aP
Evolution
of
the
novel
coona-
viras
from
the
ongoing
WuUan
ontbreaP
and
modeling
of
id
spine
protein
for
Osk
of
human
transmission[
J]
.
Sci
China
Lid
Scf
2626,
55(5)
:
457Q66.
[4
]
Sisay
M.
5
CL
pro
indibitow
as
a
potextiai
tUerayeytic
option
for
COVID-19
:
AvailaPIc
evibence
and
ongoing
cbnicai
toals
[
J
].
Phawnacologicai
Research
,
2626,
155(1)
:
12.
[5]
Pi/aiyar
T
,
Manicham
M
,
Namasivvyam
V,
et
al.
An
overview
of
severe
acote
respiratoe
syndome-coonaviws
(
SARS-CoV
)
5
CL
protease
indibitow
:
yeptibomimetics
and
smali
mcCecyIe
chemotherapy[
J]
.
J
Med
Chem,
264,
59(4)
:
05952028.
[5
]
Needic
D
,
Lonatos
GT
,
Wauph
DS.
Structures
of the
Mibdic
East
respiratow
syndrome
coronavirus
3C-Cne
protease
oveai
insights
into
sulstrate
specUicity
[
J]
.
Acta
Cwstallograyyicc
:
2615,
71(5)
:
1192-1ll1.
[7
]
Cao
B
,
Wang
Y
,
Wen
D
,
et
aP
A
T/aI
of
LopFaviFRiFnavis
in
aOults
hospitalized
with
Severe
Covib-4
[
J]
.
N
Engl
C
Med
,
2624
,382(4
)
:
4872799.
[8
]
DePghani
B
,
Haskemponr
T
,
HasanskaPi
Z.
Interaction
of
Hu
位及免疫原性
[]
.
微生物学通报
,
264
,
45(4)
:
45212.
[12
]
张越
,
尹维文
,
赵旭
,
等
.
刚地弓形虫钙依赖性蛋白激酶
2B
的生物信息学分析[]
.
中国病原生物学杂志
,
2613
,
15(4
)
:
495242,148.
[3]
Mandai
M
,
MuUUopayUyay
A,
Maulib
U.
Prediction
of
protein
suUcellulas
localization
by
incorgorabng
multiodjective
仍
。
-
based
feature
subsei
8616€200
into
the
genewi
form
of
Chon
/
PseAAC[J].
Medicai
&
BFlogical
EngineeOng
&
Computing
,
2615,
55(4)
:
351244.
[
4
]
邱艳
,
周晓蕾
,
桂碧玉
,
等
.
单纯疱疹病毒
II
型
gE
糖蛋白
B
细胞表位的预测及初步鉴定
[J
]
.
国际病毒学杂志,
2419
,
24(5
)
:
412R10.
[15
]
刘雅洁
,
薛罛
,
邱诗蕊
,
等
.
烟草
M
汕转录因子基因的克
隆及其表达分析
[]
•
华北农学报
,
2419,
34(5
)
:
2522.
[
5
]
周雍
,
魏磊
,
景炳年
,
等
.
基于非结构蛋白
NS1
结构预测
解析猪细小病麦致病性差异
[]•
河南农业科学
,
2426
,
49
(4
)
:
158-140.
[
17
]
Chen
C
,
Aldaouisk
M
,
Li
Q,
et
ai.
Triggered
inimunc
response
FOuced
by
antigenic epitopes
cevalenPy
lindeP
wiO
immunoaO-
juvvdt-4ulsey
deydOtic
cells
a
a
promising
cancer
vaccine]J].
Jonwal
of
Immunology
Research
,
2424
,
2626(1)
:
1-19.
[3]
Drexler
JF
,
Glcxa-Rausch
F
,
610x00
J
,
et
al.
Genomic
chas-
acteOzation
of
severe
acote
respiratow
syndomc-related
cowna-
viws
in
euwpeao
bap
and
classiFcation
of
coronaviruses
based
on
pa/ial
RNA-4epeyOeyt
RNA
polymerase
gene
sequeyces
[J].
Journal
of
Virology,
264,
84(21)
:
143221349.
[
9
]
黄宇良
,
汪立平
,
陆克文
,
等.
片球菌素砂必基因的原核
表达
、
纯化及
r
生物信息学分析
3].
生物技术通报
,
2417,
35(12
)
:
144-156.
[24]
JayapraOask
NG
,
Surolia
A.
Role
of
glycosylation
in
nucleatFa
protein
folding
and
staOi/ty
[
J
].
Biochemical
Jouwai,
264,
474(4)
:
2335-2347.
[21
]
Jo
S
,
Kim
S
,
Shin
DH
,
ei
al.
Indibi/on
of
SARS-PoV
5CL
protease
by
Oavonoibs
[
J
].
Jonwal
of
Enzyme
Inhibition
&
MedicFal
Chemisto,
2624
,
35(1
)
:
145-151.
[22]
Setti
L,
Passarini
F
,
Gennaro
GD
,
et
al.
AirUoruc
transmission
route
of
COVID-19
:
why
2
metew/6
wet
of
inter-peocxai
dis
tance
could
oct
be
exouvh
[
J
].
International
Journal
of
EnvF
ronmextal
Research
&
Public
Health
,
2626,
17(8)
:
2934.
[25
]
云俊
,
张原
,
尤罛,
等•新型冠状病毒肺炎
(
COVID-19
)
传染
病传播动力模型的综述[J
]
中华医学科研管理杂志,
2424
,
35
(zl)
:
E614.
发布者:admin,转转请注明出处:http://www.yc00.com/num/1715599986a2642959.html
评论列表(0条)