2024年5月18日发(作者:路由器什么牌子好信号强)
中国人民公安大学学报
(
自然科学版
)
2020
年第
4
期
No.
4
2020
Journal
of
Peopled
Public
Security
University
of
China
(
Science
and
Technology
)
总第
106
期
Sum106
翻录对语音真实性检验的影响研究
倪令格
,
王华朋
,
刘元周
,
张琨瑶
,
牛瑾琳
(
中国刑事警察学院公安信息技术与情报学院
,
辽宁沈阳
110854)
摘
要
目的深入研究在法庭语音证据的真实性检验中
,
翻录操作对常用声痕迹特征产生的影响
。
方法录制
100
段原始语音
,
其中
20
段语音经实验室
、
室外环境直接转录
,80
段语音进行篡改处理后利用不同采样设备转录
,
得到
翻录后语音
。
然后使用声纹鉴定工作站及
Adobe
Audition
软件对翻录前后的数字音频
,
分别在文件属性
、
听觉和图
谱检验等方面进行比对和分析
。
结果翻录过程会留下操作本身产生的声痕迹特征
,
在声谱图上表现为语音的本底
噪声增强
、
频响范围改变
、
动作声痕迹遗留
;
翻录时高采样率设备平滑篡改痕迹的效果优于低采样率设备
。
结论总
结岀翻录对文件属性
、听觉分析
,
篡改点图谱等造成的影响及翻录后篡改痕迹的变化规律
,
实验结果对司法语音真
实性检验具有重要借鉴价值
。
关键词
翻录
;
法庭语音
;
真实性
;
声谱图
中图分类号
D918.
9
文献标志码
A
The
Research
on
the
Impact
of
Replay
Attack
on
Speech
Authenticity
Verification
NI
Lingge
,
WANG
Huapeng
,
LIU
Yuanzhou
,
ZHANG
Kunyao
,
NIU
Jinlin
(
School
of
Public
Sourity
Information
Technology
and
Intelligence
,
Criminal
Investigation
Police
University
of
China
,
Shenyang
110854,
China)
Abstract
: Objective
Researching
the
influence
of
replay
attack
on
voiceprint
features
on
the
authenticity
verification
of
forensic
speech
evidence.
Methods
In
this
paper
,
100
original
voices
were
recorded
,
20
of
which
were
directly
transcribed
in
the
laboratory
and
outdoor
surroundings
,
and
80
of
which
were
tampe
red
first
and
then
transcribed
by
different
sampling
devices.
After
obtaining
the
replay
attack
voices
,
we
use
software
such
as
Voiceprint
Identification
Workstation
and
Adobe
Audition
to
compare
and
analyze
them.
To
distinguish
normal
speech
and
replayed
speech
,
file
attribute
inspection
,
auditory
inspection
and
spectrogram
inspection
are
performed
.
Results
The
results
show
that
the
intrinsic
voiceprint
character
istics
are
manifested
by
replay
attack.
Compared
with
the
original
audio
features
,
the
background
noise
is
enhanced
,
the
frequency
response
range
is
changed
,
the
operation
voiceprint
appears
,
etc.
Meanwhile
,
we
concludes
that
,
for
the
smooth
effect
of
tampered
trace
,
the
device
with
high
sampling
rate
is
better
than
the
device
with
low
sampling
rate.
Conclusions
The
impact
of
replay
attack
on
file
attributes
,
audito-
收稿日期
2020-03-26
基金项目
2017
国家重点研发计划项目
(
2017YFC0821000)
;
2016
国家社会科学基金重点项目
(
16AYY015)
;
上海市现场物
证重点实验室开放课题基金
(2018XCWZK09)
;
重庆市高校刑事科学技术重点实验室
(
西南政法大学
)
开放基金
(XKZDSYS2019-Z1)
;
中国刑事警察学院研究生创新能力提升项目(
2019YCYB42)
;
辽宁网络安全执法协同创新
中心资助
(
LN2017005)
。
作者简介
倪令格
(
1993—
)
,
女
,
山东济宁人
,
在读硕士研究生
。
研究方向为法庭语音证据
。
通讯作者
王华朋
(
1979—
)
,
男
,
博士
,
教授
。
:
18785296@qq.
com
•
8
•
倪令格等
:
翻录对语音真实性检验的影响研究
ry
analysis
,
spectrogram
characteristics
of
tampered
point
,
and
the
changes
of
edited
trace
after
playback
attack
are
summarized
・
The
experimental
results
have
crucial
referable
value
for
the
authenticity
detection
of
forensic
speech
・
Key
words
:
replay
attack
;
forensic
speech
;
authenticity
;
spectrogram
0
引言
系统性研究
。
本文重点从声谱图角度分析
,
关注噪
声检验
、
文件属性和听觉检验
、
异常图谱检验过程
使用录音设备录制正在播放的音频以获得新数
中
,
翻录时噪声特征
、
篡改点的改变
、
频带特征和频
响范围的改变;同时总结翻录后篡改痕迹的变化规
字音频资料的过程
,
叫做翻录
。
翻录的存在,对法庭
语音证据真实性检验产生一定威胁
。
随着科学技术
及电子设备的快速发展和运用
,
人们利用手机或电
脑即可轻易获得高质量的数字音频
,
且对录音资料
进行编辑加工等操作简单易行
。
在音频篡改拼接
中
,
翻录通常被用作后处理方法
,
弱化甚至抹除篡改
痕迹,使获得的伪造音频听起来更自然
。
此外
,
翻录
可以通过预先录制当事人语音进行回放来伪造说话
人
,
扰乱身份认证系统
,
攻击声音解锁功能
,
文献中
也表明在说话人自动识别系统中翻录语音的识别错
误率增加
[
1
]
。
因此
,
翻录语音真实性检测成为法庭
取证的一个重要环节
。
Villalba
J
等人
[
2
]
发现翻录改变了信号的频谱
和调制指数
,
这种改变可以被判别分类器检测到
,
对
区分原始音频和翻录音频具有较好的效果
。
罗达等
人发现翻录可以改变音频的信噪比
(
SNR
)
,
而且翻
录获得的音频频带稍微减弱
[
3
]
。
Chettri
B
等人
[
4
]
通
过实验分析表明
,
部分真实语音中前几帧的能量较
剩余帧更低
,
存在离群值
(
奇异值
)
,
而翻录语音的
各帧之间的能量分布似乎是均匀和平滑的
。
谢志峰
等人通过使用当下发布的
ASVspoof
2017
和
BATS
2016
,
比较了梅尔频率倒谱系数
(
MFCCs
)
、
线性倒
谱系数
(
LFCCs
)
、
翻转梅尔频率倒谱系数
(
IMF-
CCs
)
、
常数
Q
倒谱系数
(
CQCCs
)
和瓶颈特性
5
个特
征
,
表明
MFCCs
及瓶颈特征优于其他特征
,
且通过
增加滤波器和倒谱箱的数量
,
可以显著提高欺骗检
测系统的性能
[
5
]
。
但这些都很难通过谱图直接观
察得知
,
故而很难应用于司法语音的真实性检验过
程中
。
法庭语音的真实性检验是一个系统检验的过
程,其技术
、
方法较为成熟
,
王华朋
[
6
]
研究了常见语
音被编辑加工痕迹的检验方法
,
刘满良等人
[
7
]
从文
件属性检验
、
听觉检验和声学检验
3
个模块分析
,
进
行语音原始性检验
。
翻录操作会对法庭语音证据的
真实性检验产生重要影响
,
但翻录对其影响暂未有
律及其在语音真实性检验中的应用
。
1
原始语音和翻录语音的产生过程
原始语音和翻录语音的产生过程如图
1
所示
,
本实验共录制
100
段原始语音
,
语音时长
2~6s,
包
含相对静音片段
。
采样率为
48
kHz
的
30
段
,
量化
精度
32
bits
;
采样率为
16
kHz
的
70
段
,
量化精度
16
bits
。
说话人
图
1
原始语音和翻录语音的产生过程
对其中
20
段原始语音
(
48
kHz
)
经室外
、
实验室
环境转录
,
研究相同设备下翻录操作对背景噪声及
本底噪声的影响
;
对其他
80
段语音
,
进行篡改处理
(
插入
、
抹除
、
剪切
、
不同频响范围拼接
)
,
并分别用
高低采样率设备进行转录
,
研究翻录设备采样率不
同对于篡改点声谱图的影响
,
同时观察翻录操作本
身的声痕迹
。
设备信息具体如下
:
原始语音及翻录过程涉及
到的高采样率
(
48
kHz
)
设备为
HUAWEI
MATE
10,
低采样率设备
(
16
kHz
)
为
Honor
Che1-CL10,
翻录
时
,
播放设备为手提电脑
Lenovo
小新
Air
14IKBR,
播放响度
60
dB,
录制设备距离扬声器
40
~50
cm
。
2
翻录操作对法庭语音真实性检验的影响
2.
1
翻录对音频噪声的影响
2.
1.
1
对声学环境噪声的影响
音频资料在翻录过程中
,
必然增加
3
种噪声元
素
,
即声学环境
(
AE
)
噪声
、
播放设备
(
PD
)
噪声和录
-
9
-
倪令格等
:
翻录对语音真实性检验的影响研究
制设备
(
RD)
噪声
,
但后两者很难区别开来
。
故实验
采用相同播放设备
、
录制设备,控制播放音量
、
录制
距离相同的情况下
,
研究声学环境噪声对原始音频
影响
。
结果表明
,
翻录会增加原始音频的背景噪声
,
改变音频信噪比
,
且室外翻录语音段信噪比明显
降低
,
如图
2
所示
。
实验室环境下录制的语音背
景噪声差距较小
,
需结合其他特征进行分析识别
,
但室外环境下录制音频
,
不仅增加非语音段的整
体噪声
,
而且在语音段还会附加无规则噪声信息
,
如图
3
所示
。
根据录制时刻的不同
,
增加的噪声
种类
、
大小也不尽相同
。
在语音原始性检验过程
中
,
着眼于背景噪声与送检方声称录制环境的不
符
,
鉴别语音真实性
。
2.
1.2
对本底噪声的影响
音频中
,
背景噪声和本底噪声是独立的,本底噪
声主要由与麦克风相关的电子元件及编码传输失真
产生的噪声组成⑻
。
录音设备的本底噪声是设备
本身产生的
,
是一种在没有信号输入的情况下也能
产生的噪声
。
翻录过程中
,
为保证语音录制的完整性
,
往往会
优先开启录制设备,再回放音频
。
分析实验所得
,
本
底噪声弱
,
开启音频后
,
本底噪声突然增强
,
在声谱
图上会表现出播放设备开启前后本底噪声的明显差
异
,
如图
4
所示
。
不同的录音和回放设备引入不同的噪声
2 * * * * * *
[
9
]
*
(
麦
克风
、
扬声器
、
抖动电路
、
前置放大器
、
功率放大器
、
输入和输出滤波器
、
A/D
、
D/A
、
取样保持电路等都
会引入相应的噪声
〔
⑹
,
这些噪声叠加在翻录语音
上,使得翻录后的语音与原始语音存在细微的差异
。
在语音真实性检验过程中
,
持续且规则噪声的出现
,
考虑为音频翻录事实的存在
。
2.
2
翻录对文件属性
、
听觉检验影响
法庭语音的检验程序主要包括文件属性分析
、
-
10
-
听觉检验和声学检验
3
个方面
,
通过分析比对原始
音频与翻录音频
,
研究翻录操作的影响
,
并检验分析
翻录语音的真伪性
。
2.
2.
1
翻录对文件属性检验的影响
对数字音频进行文件属性检验
,
主要包括文件
名
、
创建时间
、
修改时间
、
音频时长
、
格式
、
MD5
码
、
采样率及声道数目等
,
此外还能获得音频格式信
息
[
11
]
。
(1)
初级检验
:
由于翻录语音的伪造性
,
其录制
设备与原始设备往往不同
,
音频格式信息也会有所
差异
,
故核实检材录音与其声称送检录音设备中其
他录音文件属性的异同
,
检材录音的文件属性与送
检方声称的录制情况是否存在矛盾
,
辨识检材语音
的真伪
。
(2
)
文件名隐藏的信息
:
如文件名为
的音频
,
文件名时间为
“
录制
开始的时间
,
文件名时间
+
录制时长
=
文件修改时
间
”
。
翻录语音与原始语音录制时间必然相违背,
根据音频录制时间的唯一性
,
发现检材音频文件与
送检方声称录制时间的矛盾,
推断该语音的真实性
。
(3)
文件属性中包括创建时间
、
修改时间
、
访问
时间等信息
,
结合翻录事实
,
根据各时间信息的矛
盾,推断此音频文件的真实性
。
2.
2.
2
翻录对听觉检验的影响
考虑到对音频进行翻录的主要目的是为了掩盖
篡改事实,伪造录制环境
,
故针对翻录语音的听觉检
验主要包括仔细审听
、
理解语义
、
异常分析
3
个
阶段
。
倪令格等
:
翻录对语音真实性检验的影响研究
第一阶段
,
审听送检语音的整体情况
,
看交谈是
有卡顿
、
不流畅的地方
。
因翻录语音常存在录音环
境与当事人声称的不一致
,
故关注细节
,
重点听背景
声音中是否存在突兀声音的加入,音强高低是否有
明显改变
。
第二阶段
,
理解谈话内容
,
了解事情发生的来龙
图
4
播放设备开启时本底噪声痕迹
去脉与目的
。
考虑到篡改操作不仅可以拼接
、
复制
,
也可能改变说话人的音色
,
而翻录可以将这些特征
固定下来,故检验时辨识交谈者身份是否相符
,
语义
不能对音频直接删除
,
否则将导致删除后音频错位,
而采取静音操作
。
静音痕迹在波形图上表现为没有任何的振动信
是否连贯,说话人是否存在伪装现象
。
第三阶段
,
因翻录语音的真伪性识别相对困难,
重点分析听觉中断或异常的位置
,
关注非常见的词
语或语法的表达
,
针对背景声音不连贯或异常的位
置多次进行真实性排查
。
2.3
翻录对异常图谱声学检验的影响
声学检验常通过分析频谱图或声谱图的表现
,
以发现音频编辑加工出现的痕迹
,
对不同篡改操作
及翻录音频进行声学检验
,
并给出翻录对篡改痕迹
的影响
。
2.
3.
1
翻录对插入拼接痕迹的影响
插入拼接痕迹是指向一段音频内插入来自语音
文件或其他语音文件的语音片段
,
以求更改语音表
达的意思,达到混淆视听的目的
[
⑵
。
语音证据的提
供方往经常采取插入拼接的方式
,
加入自身有利的
信息以更改原始语义
,
试图掩盖事实真相
。
由于录音设备的不同或录制环境的差异
,
在图
谱上可见本底噪声和背景噪声的不同
,
表现为噪声
的大小和分布差异
,
在拼接处存在明显整齐的边缘
(
复制或剪切痕迹处也会表现出明显的边界
)
,
在听
觉感知上可以通过背景噪声的突然变化加以区
分
[
13
]
。
如图
5
所示
,
将文本为
“
电话号码
”
的语音插入
拼接至采样率为
16
kHz
的原始音频中
。
根据本底
噪声周边检验法
,
可见其开始
、
结束及上方出现整齐
的边缘分割痕迹
。
经过低采样率
(
16
kHz
)
的设备翻
录后
,
结束位置的边界变得模糊
,
变化程度较轻
;
经
过高采样率
(
48
kHz
)
的录音设备翻录后
,8
kHz
以上
位置出现本底噪声
,
同时插入拼接处痕迹几乎被全
部掩盖
,
高于原采样率一半的频率区域能量为
0
。
2.
3.
2
翻录对抹除
(
静音
)
类痕迹的影响
抹除类痕迹是指语音证据的提供方抹除语音中
对己方不利的语音片段或字词
,
而把对己方有利的
部分留下
〔
⑵
。
此类痕迹经常出现在视频证据中
,
因
号
,
即使对波形进行放大
,
声波的采样点数据亦几乎
为零
。
在声谱图中会表现出现间断现象
,
使用不同
的软件观察可见白色或黑色的空白区域
,
没有任何
的频率的能量存在
,
即使在相对静音段进行抹除
,
在
图谱中亦能表现出明显的分界线
。
如图
6
所示
,
此处被抹除的语音文本为
“
我欠
你
”
。
经低采样设备翻录后
,
该静音痕迹被部分抹
除
,
但在静音段两侧出现微弱的能量条
,
解释为播放
设备在遇到静音段时频率的改变而产生的播放痕
迹
。
在咼采样率设备翻录后
,
静音痕迹被完全抹除
。
a.
原始插入拼接痕迹
电话号码
-
lk
b.
低采样设备翻录
c.
咼米样设备翻录
Hi
图
5
插入拼接痕迹及低
、
高采样设备翻录声谱图
语音真实性检验过程中
,
当静音类痕迹被翻录
时
,
人工检验时不能通过声谱图发现其抹除痕迹
,
但
在听觉感知上可能会出现上下文逻辑混乱
,
说话内
容突兀
,
与正常交流的内容相差甚远
,
出现非正常的
听觉中断或异常的情况
。
2.
3.
3
翻录对剪切
/
删除类痕迹的影响
剪切
/
删除类痕迹是指证据提供方为了自身需
求
,
剪切或删除掉对自己不利的录音片段
,
而形成的
-
11
•
倪令格等
:
翻录对语音真实性检验的影响研究
编辑后痕迹
,
一般表现为听觉异常或本底噪声差异
大
,
声谱图中剪切痕迹两侧分界明显等
。
围
,
因此判断为篡改痕迹
。
使用低采样率对该篡改
痕迹进行翻录时
,
由于采样率的限制
,
完全抹除频响
范围差异的痕迹
,
表现为前后语音相同频响范围;使
根据汉语语法规则可知
,
两个声母不能连续出
现
,
而一般剪辑操作者不会特别注意此问题
,
给我们
用高采样率设备对篡改音频进行翻录
,
则可重现编
辑痕迹
,
从而发现修改事实
,
识别数字音频的非真实
性
。
无论图谱表现与否,在听觉感知上
,
翻录语音中
在检验其真实性方面提供了便利
。
如图
7
所示
,
声
谱图中为
/sh/
和
/ch/
两个声母相连的遗留痕迹
,
经
低采样设备
、
经高采样设备翻录后
,
编辑痕迹被抹
经过修改处的语音明显增强
,
由此可以作为辨别其
除
,
但
/sh/
和
/ch/
两个声母相连的事实不会改变
,
仍
然存在听觉异常
。
而且
,
翻录后擦音部分出现共振
峰
,
但未见第一共振峰
,
此共振峰的出现与播放设备
有关
。
图
6
静音痕迹及低
、
高采样设备翻录后声谱图
同时
,
在声谱图中
,
只有塞音
(
如
b,p,d,t
等
)
和
塞擦音
(
如
z,q
等
)
前因气流突然爆破才会出现冲
直条
,
其他的音节都是一个逐渐增强又减弱的一个
过程
。
2.
3.
4
翻录对频响范围改变痕迹的影响
语音在篡改过程中
,
由于录制设备的不同
,
可能
出现音频采样率的不同
,
低采样率设备与高采样率
设备录制的音频拼接后
,
声谱图上会表现为音频的
频响范围明显不同
。
高采样率设备录制低采样率语
音时,
可见翻录语音中高频部分出现明显的能量缺
失现象;低采样率设备录制高采样率语音时
,
相当于
对原始语音进行降采样
,
部分翻录语音的本底噪声
上边缘整齐
,
与一般真实性语音不符
。
如图
8
所示
,
原始语音文件为低采样率
,
而被加
入高采样率的一段音频
,
这不仅使数字音频资料的
整体采样率发生改变
,
而且可以清晰观察到声谱图
中插入音频处的频响范围明显大于其两侧的频响范
-
12
-
真伪性的依据
。
图
7
剪切痕迹及低
、高采样设备翻录后图谱表现
2.
4
音频翻录操作声痕迹特征
音频在翻录过程中
,
不仅会出现平滑甚至抹除
篡改痕迹
,
而且其操作本身会留下一定的声痕迹
,
根
据观察比对原始语音与翻录语音
,
结合操作事实得
出以下两方面固有特征
。
2.
4.
1
音频翻录频带能量特征
频带是指无线电频谱上位于两个特定的频率界
限之间的部分
。
根据实验观察声谱图发现
,
翻录操
作能够改变某频带范围内能量的强弱
,
将其解释为
播放设备与录制设备的相互干扰
,
使翻录后音频声
谱图中表现出类似于
“
带阻滤波器
”
的效果
,
从而减
弱该频带范围的能量
。
该实验中使用的低采样设备
翻录音频声谱图显示
,
降低了频带为
3
kHz
左右的
能量
,
而高采样设备降低了频带
6
kHz
左右及
4
kHz
左右的能量
,
如图
9
所示
,
白色区域内深色条带
。
不
同设备翻录后频带减弱范围不同
,
且能量降低的程
度存在差异
,
但该特征相对稳定且易于观察
。
当声
谱图中出现某固定频带范围内能量减弱
,
应考虑为
音频被篡改或经翻录形成的可疑点
。
2.
4.
2
翻录操作动作痕迹特征
语音的翻录可以对多个音频起到拼接作用
,
断
章取义得到目标音频
,
最常使用暂停
、
继续等按键操
倪令格等
:
翻录对语音真实性检验的影响研究
图
8
不同采样率音频拼接痕迹表现及不同设备翻录
后声谱图
作
。
若在录音过程中有暂停行为
,
说明得到的数字
音频不具备真实性
,
也表明出现暂停按键动作会遗
留下暂停按键声音痕迹
〔
⑷
。
实验研究证明
,
手指在触摸到手机屏幕使其暂
停的时刻
,
时域波形图上出现单条竖线状短时刻振
幅
,
操作后因设备反应延迟音频仍在录制
,
直至真正
暂停
。
再次开始时
,
按键操作痕迹没有图谱痕迹显
示
,
但开始时音频录制会出现延迟现象
,
能量图谱中
对应区域出现空白
,
如图
10
所示
。
1
__________
貝
:
j
1
-lk
Hz
-
10k
1
1
-
lk
图
9
不同设备翻录后音频频带能量改变
同一台设备录制后留下的暂停痕迹不尽相同
,
这与每次按键的快慢
、
力量大小的不同
、
按键的机械
结构相关
[12]
o
使用不同设备
、
不同触摸方式
,
图谱
表现也相差甚远
。
图
10
暂停
、
继续痕迹
3
翻录痕迹特征分析及其在语音真实性检验中的
应用
根据实验设计
,
将文中提及的相关痕迹特征的
语音段进行统计并得到表
1
。
表
1
实验中相关痕迹统计信息
出现痕
翻录语
音频痕迹信息
迹语音
音数量
/
翻录语音
痕迹出现
段数量
/
数量
(
段
)
(
段
)
频率
段
(
16
kHz
)
(
48
kHz
)
0
—
20
(
实验室
)
0
无规则噪声信息
8
—
20
(
室外
)
40%
20
—
20
(
实验室
)
100%
本底噪声改变痕迹
20
—
20
(
室外
)
100%
20
20
100%
频响范围改变痕迹
20
—
20
100%
61
80
76.
25%
频带能量特征痕迹
89
—
120
74.
17%
翻录操作动作痕迹
23
80
120
11.
5%
可见
,
本底噪声改变痕迹
、
篡改后翻录语音频响
范围改变痕迹的出现是稳定的
,
能作为识别翻录的
重要依据;而不规则噪声
、
频带能量减弱及翻录动作
留痕的出现存在偶然性
,
其中频带能量特征痕迹特
征出现率高
,
若在检验过程中发现异常
,
可作为语音
真实性检验的参考因素
。
在常规法庭语音真实性检验的基础上
,
出现声
谱图中出现以下特征
,
则考虑为篡改后的翻录语音:
(
1
)
当音频中出现本底噪声明显差异
,
应考虑
为翻录操作中音频播放的起始位置
。
(
2
)
当音频表现出背景噪声差异
,
可观察到异
常语音段声谱图分界明显而有别于常规插入拼接痕
迹
,
尤其是出现整齐的上边缘
,
应考虑为插入拼接篡
-
13
-
倪令格等:
翻录对语音真实性检验的影响研究
改后的翻录语音
。
(3)
当录音文件中出现相对静音段或前后文语
义不连贯
,
但图谱表现中仍存在连贯的本底噪声
,
应
考虑为抹除篡改后的翻录语音
。
(4)
当声谱图中出现某固定频带范围内能量减
弱或增强
,
应考虑为音频被篡改或经翻录形成
。
(5)
根据声谱图及汉语规则
,
当录音文件中出
现元音的谱图呈现无规律变化或具有塞音
、
塞擦音
、
擦音遗留痕迹
,
且声谱图中过渡平滑
,
应考虑为剪
切
/
删除篡改后的翻录语音
。
(6)
当图谱中出现明显频响范围不同
,
主要使
用比对法是在相似语音环境下使用原始录音设备录
制一个语音样本
,
对比两者频响范围
[7]
o
若二者差
异明显
,
则考虑为篡改痕迹
。
4
结论
为打击不法分子利用翻录语音进行违法犯罪
、
断章取义伪造音频
,
利用翻录操作平滑甚至抹除音
频篡改痕迹的现象
,
通过分析对比原始
、
篡改语音及
200
段翻录语音数据
,
研究了翻录特征及其对文件
属性检验
、
听觉检验及篡改点痕迹的影响
,
并对翻录
后的篡改痕迹改变规律进行了总结
。
结果表明
,
翻
录过程存在其固有特征
,
即翻录过程使原始音频中
固定频带范围的能量减弱
,
动作声痕迹遗留
,
背景噪
声及本底噪声增加;翻录操作在包含文件属性检验
、
听觉检验和异常图谱声学检验的整个语音真实性检
验过程中都产生作用及影响
,
且高采样率设备翻录
后的平滑效果更明显
。
研究翻录对法庭语音真实性
检验的影响
,
不仅完善了司法语音的内容检验范畴
,
而且能够对于制止网络中出现的不实语音恶意攻击
具有借鉴意义
,
从而打击犯罪
、
维护社会公共安全
,
同时保证自动说话人识别系统中身份验证
、
信息检
索的准确率
。
未来
,
针对翻录语音进行真实性检验
会朝着更加智能化的方向发展
。
参考文献
[
1
]
KINNUNEN
T,SAHIDULLAH
M
,
HECTOR
D,et
al.
The
ASVspoof
2017
challenge
:
assessing
the
limits
of
replay
spoofing
attack
detection]
C
]
椅
Interspeech.
2017.
Stock
-
14
•
holm
,
Sweden
,2017.
[2]
VILLALBA
J,
LLEIDA
E.
Preventing
replay
attacks
on
speaker
verification
systems
[
C]
椅
IEEE
International
Carnahan
Conference
on
Security
Technology.
Barcelona
,
Spain
:
IEEE,2011
:
1
-8.
[3
]
LUO
D, WU
H,
HUANG
J.
Audio
recapture
detection
u
sing
deep
learning
[
C]
椅
IEEE
China
Summit
&
Interna
tional
Conference
on
Signal
&
Information
Processing.
Chengdu
,
China
:
IEEE,2015
:
478
-482.
[4]
CHETTRI
B
,
STURM
B
L
,
BENETOS
E.
Analysing
replay
spoofing
countermeasure
performance
under
varied
condi
tions
[
C
]
椅
2018
IEEE
28
th
International
Workshop
on
Machine
Learning
for
Signal
Processing
(
MLSP)
.
IEEE
,
2018
:
1
-6.
[5]
XIE
Z
F
,
ZHANG
W
B
,
CHEN
Z
X
,
et
al.
A
Comparison
of
Features
for
Replay
Attack
Detection
[
C]
椅
2019
3rd
International
Conference
on
Machine
Vision
and
Informa
tion
Technology
(
CMVIT
2019).
Guangzhou
,
China
:
IOP
,
2019.
[6]
王华朋
.
常见语音被编辑加工痕迹的检验方法
[J].
警
察技术
,2017(3)
:
54
-56.
[7]
刘满良
,
邵冬梅
,
焦娇
.
视频案件中语音的真实性检验
研究
[J].
警察技术,2019(5)
:
52
-55.
[8]
裴安山
,
王让定
,
严迪群
.
基于设备本底噪声频谱特
征的手机来源识别
[J].
电信科学
,
2017,33
(1
)
:
85
-94.
[9]
王志锋
,
贺前华
,
张雪源
,
等
.
基于信道模式噪声的
录音回放攻击检测
[J].
华南理工大学学报
(
自然科
学版
),
2011,
39(10)
:
7.
[10]
POHLMANN
K
C.
Principles
of
digital
audio
[
M].
Washington
:
Butterworth-Heinemann
,
1995.
[11]
王英利
,
李敬阳
,
曹洪林
.
声纹鉴定技术综述
[J].
警
察技术
,
2012,
4(5)
:
4
-56.
[12]
王华朋
,
姜囡
.
司法语音检验
[M].
沈阳
:
东北大学
岀版社
,2017.
[13]
廖翔
,
赵志龙
,
庞业光
.
声像检验鉴定技术概述
[J].
警察技术
,
2006(6)
:
46
-47.
[14]
岳俊发
,
王英利
.
声纹鉴定
[
M].
北京
:
警官教育岀
版社
,2000:134
-140.
[15]
公安部政治部
.
言语识别与鉴定
[
M].
北京
:
中国人
民公安大学岀版社
,2015.
(
责任编辑
陈小明
)
发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1716007817a2705699.html
评论列表(0条)