语音资料真实性(完整性)的系统鉴定研究

语音资料真实性(完整性)的系统鉴定研究


2023年12月10日发(作者:小米社区官网下载)

   2019年第1期NO.12019云南警官学院学报JournalofYunnanPoliceCollege总第132期Sum132 语音资料真实性(完整性)的系统鉴定研究胡健松 殷启新 陈丁文(云南警官学院,云南·昆明 650223)内容摘要:使用10名话者的12种信道录制实验语音资料,用AdobeAuditionCS6进行剪辑编辑处理,用数字音频分析鉴定系统“VS-99(4.0)计算机语音工作站,阳宸IV-12智能语音工作站V8.0”研究其听觉特征、属性特征、波形图谱特征和开展了频谱分析工作,表明数字音频文件的真实性(完整性)鉴定是一个系统检验工作。通过检验音频文件的听觉特征、属性、时域特性和频域特性,综合评断的结果可以明确得出“发现或未发现音频文件存在剪辑编辑的痕迹”的判断。关键词:语音资料;数字音频分析鉴定;频谱分析中图分类号:G423.04   文献标识码:A   文章编号:1672—6057(2019)01-56-15引言数字语音资料的真实性完整性鉴定技术,其本身涉及的内容非常广泛而丰富。一份数字语音资料理论上包含话者个体特征、背景、录音内容、事件发生发展过程、语音物理特性、数字音频特性、信道(录音设备)信息、软件信息等等内容。一份数字语音文件经过篡改将造成上述信息内容发生变化,产生篡改痕迹。司法实践中如何鉴定一份数字录音文件的真实性,主要是通过检验是否经过剪辑编辑处理。这项工作是一个综合性和系统性很强的工作,数字语音文件是否经过剪辑编辑,其痕迹特征表现是多方面的,有的是宏观特征,有的是微观特征,有的特征检验结果是语音资料经过剪辑编辑的必要条件,有的特征表现是充分必要条件。所以鉴定语音资料的真实性(完整性)是一个系统鉴定,最后需要综合评断才可以得出明确结论。本研究主要利用阳宸VS-99(4.0)计算机语音工作站、阳宸IV-12智能语音工作站V8.0和其他音频软件,研究数字语音文件经过剪辑编辑的属性特征、听觉特征、背景特征、信道特征和音频处理软件特征,研究数字语音文件的波形收稿日期:2018-10-20图、宽带窄带等语图和音频参数,发现剪辑编辑的痕迹。一、实验设计(一)发音人及实验录音内容话者为10名健康成年男性,无喉部疾病及手术历史,说普通话,年龄在19-21岁。同一人发音内容为句子:(1)18万我已经还你了(命名为检材);(2)我没有(命名为添改素材,简称素材)。(二)实验设备1.数字音频文件分析设备阳宸VS-99(4.0)计算机语音工作站,阳宸IV-12智能语音工作站V8.0。2.录音设备及方法、条件(1)采用12种不同的录音信道,分别是(1)SONYM-570V卡式录音机;(2)VS-99计算机语音工作站系统直接录音;(3)话者本人使用的手机(10部手机,10个信道)录音。(2)每个人在声纹分析实验室安静的环境条件下,利用上述2个信道和他本人使用的手机这三种信道按照平时两人间谈话时的节奏强度说检材和素材句子10遍并同步录音,采集语音材料研究信道对声纹鉴定的影响,研究不同信道语研究项目:本文系2016年度云南省刑事科学技术重点实验室创新研究基金项目“语音资料真实性(完整性)鉴定新技术研究”的成果,项目编号:YJXK116011。作者简介:胡健松,男,云南警官学院刑事侦查学院高级工程师,研究方向为文件检验、视听资料检验的教学、科研、办案。殷启新,男,云南警官学院信息网络安全学院副教授,研究方向为模式识别、网络安全的教学、科研。陈丁文,男,云南警官学院刑事侦查学院副教授,研究方向为文件检验、的教学、科研、办案。—56—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究料进行剪辑编辑的痕迹特征。以下表1.1是话者编号、实验人员名字及手机信道(不同手机厂牌型号)及其他信道编号。表1.1 实验话者编号及不同信道的编号话者编号H1H2H3H4姓名王××熊××刘××陈××手机信道型号及其他信道OPPOA37m红米RedmiNote5MEIZUPRO6MIMAX信道编号X1X2X3X4中复制录制所得到的数字音频文件进行保存,用阳宸IV-12智能语音工作站V8.0打开分析。经剪辑编辑的实验语料必要时也用该语音工作站直接打开分析。2.模拟录音采集方式得到音频文件:利用麦克风将音频信号通过调音台、外置声卡输入VS-99(4.0)语音工作站。调音台厂牌为“BE-HRINGERXENYX802”,声卡为“CREATIVEUSBSOUNDBLASTER24.bit”。设定采样率为11KHZ。采集时调整录音电平达到合适的数值,保证语图H5H6杨MEIZUPRO7PlusX5H7李××X6H8聂××羊××OPPOiPhoneXR9mX7张××一加OPPOOnePlusR7t5TX8X9WASH10H9-AL00高××X10××HUAWEInovayouthH11SONYM录音机-570V卡式X11H12VS-工作站直录99计算机语音X12(1.三)剪辑编辑处理采用剪辑编辑处理方法AdobeAuditionCS6软件对录音资料进行剪辑编辑处理。对同一名话者的语料进行剪辑编辑处理,把检材句子当中的“我已经”这三个音节和音节“了”进行剪切处理,然后用同一人不同信道的素材音节“我没有”作为添加语料切入检材句子中的“18万”和“还”之间,这时得到经过剪辑编辑的句子“18万我没有还你2.”。没有剪辑编辑的命名方法是有关实验语料的命名“H+话者数字编号+X+信道数字编号”。经过剪辑编辑后的语料用“H+话者数字编号+X+粘贴的语料信道编号(原文件信道编号)”来命名。H表示话者,按1-10名话者进行后缀编号,X表示信道,不同信道按后缀数字进行编号。在名称中有括号的内容为“H1X4原语料信道音段。例如实验语为第一种信道(X1),”用第四种信道语句对原始音段进表示编号为1的话者,料原文件名称行粘贴编辑(1.四。语音工作站直接打开分析)实验语音材料的处理分析方法:自录音设备不产WAV生图及45HZPCM畸变格式。采集后的音频文件保存为16位窄带语图和其他物理参数图谱。然后做出它们的300HZ宽带语,进行听辩、机是模拟录音3.识谱和分析检验卡式录音机得到的录音文件。,录制完成后直接按播放键通过耳:卡式录音机插口按上述第二种“模拟录音采集方式”将语音通过调音台输入VS-99语音工作站保存语音工作站所接受的16位WAVPCM格式。二、实验过程及其结果检验(一)音频文件是否经过剪辑编辑的听觉1.语言的物质载体语音包括多种特性实验理论基础,通过听觉的基础研究,发现以下九个语音特征是可以通过听觉来感知的:音高、发音、声音的综合品质、韵律、响度、言语技能、方言口音、社会方言、话者情态。这些特性是超出语音音素物理特性范围的,例如:基频、共振峰、过零率、频谱以及各类倒谱系数等,这些物理特性不能用听觉感知,从实验语音学角度来看,这一类特征属于音段层次,它们都是从语音音素上提取出来的,这些基本声学参数必须借助计算机技术,数字信号处理方法提取出来,通过数理统计分析,才能用于语音的分析与识别。而能为听觉感受到的那些特征,超出了音段层面,属于超音段特征,检验方法是一种主观方法。超音段言语特征的实验研究包括对听觉生理、心理进行研究,研究听觉感知的特点,例如:锐度,声音感知中的客观量、主观量、双耳效应等,那么人耳到底能够感知哪些语音特征。研究表明下述语音特征是可以感知的,即音高、发音的个体习惯动作活动、声音综合品质、韵—57—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究律、响度、言语技能、社会方言、话者的情态。通过听觉检验为案件语音的听觉检验提供了语音特征的比较检验和基本识别目标。录音资料的听觉检验用头戴式耳机对检材进行听辩以减少外界的干扰。结合案情、谈话内容、情景、事件等录音资料提供的信息,录音资料是否经过剪辑编辑的听觉检验有以下主要内容。(1)检材料录音的总体情况,如录音方式、录音声道、录音内容、对话人、环境等;(2)对话语义的关联性和逻辑性;(3)对话语音的来源及变化情况;(4)对话语音的连续性和同一性;(5)相同对话语音的相似度;(6)对话语音的自然度话题的匹配性;(7)背景声的来源及变化情况;(8)背景声的连续性和一致性;(9)背景声与对话声的重叠情况;(10)录音的起始和结束信号情况;(11)录音能量的变化情况(12)其他的与检材录音的形成陈述有关的情况。如果发现检材录音在对话声,背景声的连续性上有异常的,或检材录音中出现脉冲、信号丢失、信号覆盖等现象的,或检验情况与剪裁录音的形成陈述有矛盾的,或其他异常的情况的,分析其形成的原因,根据需要通过模拟实验分析,现场分析等方法对检材录音进行进一步检验,分析其形成的原因。2.实验过程及结果分析通过对10位发音人在不同的信道的发音材料进行剪辑编辑,得到经过剪辑编辑的句子“18万我没有还你”。根据以上内容,对检材进行听觉检验,前面谈到听觉检验是一种主观检验的方法,根据美国语音学家H.霍林提出的结构分析方法可以进行半定量的分析。把以上11个指标内容(除第一项外),人为的分成每个指标十个等级,每个项目的得分如果是低于五分,那么结论是偏向于否定方面的。鉴于设计的实验语料,不是实际案件当中的语音资料,缺乏谈话双方,事件背景、场景及前后完整内容,所以,在此课题当中只是做一些理论的探讨,在实际语音资料的检验当中,结构分析方法可以作为一种可靠的主观检验方法,得到一种种属判断的结果。表2.1听觉检验的结构分析序号19对话语义的关联性和逻辑性0-10对话语音的来源及变化情况0-10对话语音的连续性和同一性0-10相同对话语音的相似度0-10对话语音的自然度话题的匹配性0-10背景声的来源及变化情况0-10背景声的连续性和一致性0-10录音能量的变化情况0-10背景声与对话声的重叠情况0-10录音的起始和结束信号情况0-10其他的与检材录音的形成陈述有关的情况0-10结构分析参数及数值范围缺乏关联性和逻辑性来源不相同,有突变相似度不高缺乏连续性和同一性不太自然,话题缺乏匹配性背景缺乏连续性和一致性起始和结束信号不太明显能量有突变背景来源不同,有很大的变化有50%的内容和背景声重叠<5的判断表述具备关联性和逻辑性来源相同,没有变化相似度高自然,话题匹配性高具备连续性和同一性背景来源相同,没有变化50%以下内容没有重叠起始和结束信号明显能量没有突变具备连续性和一致性>5的判断表述检材录音的形成与陈述有矛盾检材录音的形成与陈述一致  所以,该结构分析表最高分数应该是110分,如果总评分数低于55,那么判断结论就偏向于否定的方面,也就是说检材有可能经过剪辑编辑。如果总评分数高于55,说明检材有可能没有经过剪辑编辑。下面举例分析剪辑编辑实验材料“H1X11—58—(X1).wav”。这个材料是第1名话者,原始音段是第一种信道,用第11种信道(SONYM-570V卡式录音机)的语句对原始材料进行剪辑编辑得到的实验材料。H1X11(X1)的分析结果:这是第一名话者用他本人的手机在安静的噪胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究音背景下所出的实验句子,然后用第11个信道的语料来进行剪辑编辑。第11个信道是卡式录音机,有很强烈的机器背景噪音,频响特性也不序号19结构分析参数及数值范围一样,当把句子“我没有”粘贴入第一个信道的原始材料当中时,结构分析参数会有一些异常的结果,如表2.2所示。<5的判断表述———23———21421———3>5的判断表述—————————————————————————————————表2.2 检材H1X11(X1)的听觉检验的结构分析结果对话语义的关联性和逻辑性0-10对话语音的来源及变化情况0-10对话语音的连续性和同一性0-10相同对话语音的相似度0-10对话语音的自然度话题的匹配性0-10背景声的来源及变化情况0-10背景声的连续性和一致性0-10录音能量的变化情况0-10背景声与对话声的重叠情况0-10录音的起始和结束信号情况0-10其他的与检材录音的形成陈述有关的情况0-10  去掉没有关联的项目,总评分数总分应该是80分。该检材结构分析表总分数为18分,换算为百分制结果为22.5%,说明该检材经过剪辑编辑的可能性很高。(二)音频文件的属性检验音频文件的属性是具有一个广泛内容的概念,包括格式信息和和数字录音的生成相关的信息。例如,时间属性、文件名属性、音频文件的参数、文件的数字结构信息和附加信息等等。一个数字音频文件是由特定的录音设备所生成的,其采集、数字编码和音频参数等都包含有特定设备的信息。对音频文件的录制设备进行鉴定是一个鉴定数字音频文件是否经过篡改的有效方法。如果能够检验一个数字音频文件所包含的录制设备的属性信息,然后和利用所声称的录音设备录制的样本文件属性进行比较,各项目信息如果一致,则声称的录音设备是检材生成的必要条件。理论上说,音频录制设备在录制音频的时候,会引入设备固有的噪音信号,这种噪音信号就像一种独特的辨别指纹,从一段音频信号中得到设备特征信息,从而将它用作判断特定录制设备的依据。所以,人们研究探讨了其他一些鉴定方法,例如特征信号分析方法、本底噪声分析方法、统计特征分析方法、设备本底噪音数字信号频谱数学模型分析方法。人们研究了多种多样的方法来确定一个数字语音文件是否经过剪辑编辑,检验文件属性或者元数据的分析方法是最有效的方法,因为一个音频文件只要经过某种软件的篡改,其音频属性必然发生变化,只要与声称的录音设备生成的录音样本属性进行比较,就能够发现音频属性或元数据的区别。下面本工作主要通过分析文件的属性检验数字音频文件是否经过剪辑和编辑。1.数字音频文件的属性信息检验音频文件的元数据(或属性)即数字录音中描述录制内容、参数和数据结构等信息的数据。数字录音都是以一定格式保存的音频文件,音频文件属性和格式信息检验是通过数字录音的文件属性和格式信息进行分析判断检材录音是否符合特定录音设备的文件的生成规律,进而判断检材录音是否为该设备录制的,即判断是否经过处理的检验方法。其文件的属性可以提供大量的某特定数字录音的生成的相关信息,如文件格式信息、时间属性、文件名属性、数字音频参数、文件结构信息和附加软件信息等。可以通过软件,例如格式工厂、Mediainfo等属性查看软件,以及AdobeAudition2.0或者CoolEditPro等软件查看数字音频文件的属性。数字录音的文件格式种类繁多,较为常见的有CD格式、WAVE(∗.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE等,还有更多录音设备的开发商开发的各种音频格式,这些不同格式的数字录音文件结构不尽相同。可以选择适当的软件,或者通过元数据的分析获得它的格式信息。所以某一个特定的录音设备录制的原始录音文件—59—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究的属性和格式信息的生成,必须遵循一定的规律,如果通过比较发现检材录音的文件属性和格式信息不符合声称的录音设备录制的原始文件属性和格式规律,则可以判定检材录音不是该设备录制的原始录音,在有些情况下可以判断检材录音经过了剪辑编辑。2.录音资料属性和格式研究过程及结果(1)实验材料的制备本研究总共设计有通过三个信道录制的录音文件。1.手机录音文件:手机包含有7种厂牌型号;2.直接通过VS-99语音工作站采集的录音资料;3.卡式录音机(SONYM-570V)录音,然后通过VS-99语音工作站采集的音频文件。本实验有十名话者使用的手机种类有7种。用各自的手机录音.所获得的音频文件有以下三种格式:(H1X1、H2X2、H3X3、H4X4、H5X5、H7X7、H8X8).mp3(H6X6、H10X10).m4a参数名称GeneralDurationFilesizeFormatH9X9.aac选取H1X1.mp3、H6X6.m4a、H9X9.aac这三个手机录音文件,用AdobeAuditionCS6软件用相同话者的第12种信道语料对其进行剪辑编辑,将原句子“18万我已经还你了”剪辑为“18万我没有还你”。把原句子中的“我已经”剪切粘贴为“我没有”,把原句子中的“了”剪切掉。将处理后的文件另存为wav格式,再用格式工厂转换为与原文件相同的格式。处理后的三个文件如下:H1X12(X1).mp3H6X12(X6).m4aH9X12(X9).aac(2)实验结果假设实验文件以拷入的电脑为其原始文件形成地址,查看的属性为原始信息。用格式工厂4.3.0查看属性。①署名“H1X1.mp3”的原文件和经剪辑编辑后的文件属性检验经剪辑处理后的文件文件H1X1.mp3格式信息MPEGAudio17s664msLAME3.98.2MPEGAudioVersion1Layer3Jointstereo/MSStereo17s664ms2channels41.667FPS(1152SPF)690KiB(100%)LAME3.98.2Lossy48.0kHz320kb/sConstant320kb/sConstant690KiBH1X12(X1).mp3格式信息MPEGAudio17s952msLAME3.99.5MPEGAudioVersion1Layer3Jointstereo/MSStereo17s952ms2channels41.667FPS(1152SPF)701KiB(100%)LAME3.99.5Lossy48.0kHz320kb/sConstant320kb/sConstant702KiBOverallbitratemodeOverallbitrateWritinglibraryFormatAudioFormatversionFormatsettingsBitratemodeChannel(s)SamplingrateFramerateStreamsizeCompressionmodeWritinglibraryBitrateDurationFormatprofile  通过比较发现MP3文件经过剪辑编辑以后,其他音频参数没有变化,但是写库(Writingli-—60—brary)的版本由原来的LAME3.98.2改变为LAME3.99.5。所以经过剪辑编辑以后,音频文胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究件的属性发生了改变,表现出剪辑编辑的痕迹。②署名“H6X6.m4a”的原文件和经剪辑编参数名称辑后的文件属性检验经剪辑处理后的文件文件H6X6.m4a格式信息H6X12(X6).m4a格式信息MPEG-4504KiBVariableGeneralFormatprofileCodecIDDurationFilesizeFormatAppleaudiowithiTunesinfoM4A(M4A/mp42/isom)25s450ms66.3kb/sUTC2018-09-1308:39:59UTC2018-09-1308:39:59AAC1Constant206KiBMPEG-4AppleaudiowithiTunesinfoM4A(isom/iso2)25s202msRecordeddateUTC2018-09-1308:39:59Lavf57.41.100AAC1164kb/sOverallbitratemodeOverallbitrateEncodeddateTaggeddateAudioIDWritingapplicationFormatcom.apple.VoiceMemos(iOS11.4.1)AdvancedAudioCodec25s450ms25s515ms2channels1channelFront:CLossy48.0kHz64.0kb/sConstantLCmp4a-40-2FormatprofileCodecIDDurationBitrateSourcedurationBitratemodeChannel(s)Format/InfoAdvancedAudioCodec25s202ms162kb/sFront:CLossyVariableLCmp4a-40-2Duration_LastFrame-14ms2channels1channel48.0kHzChannel(s)_OriginaChannelpositionsSamplingrateFramerateStreamsizeTitle46.875FPS(1024SPF)200KiB(97%)CoreMediaAudioUTC2018-09-1308:39:59UTC2018-09-1308:39:59200KiB(97%)46.875FPS(1024SPF)498KiB(99%)CompressionmodeSourcestreamsizeEncodeddateTaggeddateMaximumbitrate:288kb/sAlternategroup:1Default:Yes  经检验分析原文件和经剪辑编辑后的音频文件属性发现有许多内容方面的变化:编解码器ID(CodecID)由“M4A(M4A/mp42/isom)”变为“M4A(isom/iso2)”;原音频文件总比特率模式(Overallbitratemode)为常量改变为变量;总比特率由66.3kb/s改变为164kb/s;标记日期(Taggeddate)改为录音日期(Recordeddate);编写应用程序(Writingap-plication)反映出编辑处理等原文件改变的痕迹。由原来的“com.apple.VoiceMemos(iOS11.4.1)”改变为“Lavf57.41.100”;项目名称由原来的“源持续时间(Sourceduration)”改变为“持续时间(Duration)”;比特率模式由Constant变为Variable,比特率由64.0kb/s改—61—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究变为162kb/s;项目内容中新增加一个混合比特率(Maximumbitrate)288kb/s;源文件“源流大小”变为流大小“Streamsize”剪辑后没有标题“Title”这个项目;经处理后的文件没有“编码日期和标记日期”这两个项目(Encodeddate和Taggeddate),从属性里只列出录音日期(Recordeddate)UTC2018-09-1308:39:59,其内容和原文件的“编码日期和标记日期”一致;经处理的文件有默认(Default)Yes和替代参数名称GeneralFormat/InfoOverallbitratemodeFormat/InfoFormatAudioFilesizeFormat组(Alternategroup)这两个项目,在原文件中没有。所以格式为“m4a”的手机ipone录音文件经剪辑编辑以后,其属性发生很大的变化,通过属性检验能够发现这类文件剪辑编辑的痕迹特征。③署名“H9X9.aac”的原文件和经剪辑编辑后的文件属性检验文件H9X9.aac格式信息ADTSH9X12(X9).aac格式信息AudioDataTransportStream484KiBVariableAACLCADTS经剪辑处理后的文件AudioDataTransportStream266KiBVariableAACLCFormatversionFormatprofileBitratemodeChannel(s)FramerateAdvancedAudioCodecVersion4VariableAdvancedAudioCodecVersion4VariableChannelpositionsSamplingrateStreamsizeCompressionmode1channel46.875FPS(1024SPF)266KiB(100%)Lossy48.0kHzFront:C1channel46.875FPS(1024SPF)484KiB(100%)Lossy48.0kHzFront:C  经检验分析格式为“aac”的手机录音原文件和经剪辑编辑后的音频文件的属性发现所有的格式信息项目内容没有变化,无论是项目的内容或数量,都没有发生变化。说明具有aac这种格式的音频文件,经过剪辑编辑以后其属性可能没有发生太大的变化,可能通过属性分析不能发现其剪辑编辑的痕迹特征。通过上述的研究工作发现,从检验音频文件的属性这个角度发现剪辑编辑的痕迹特征,其属性方面的项目内容变化多少取决于音频文件的格式,有的音频文件经过剪辑编辑以后项目内容变化比较多,有的就比较少。例如,iphone的手机录音文件属性改变较大。有些格式的音频文件很难发现属性方面的差别,例如,格式为acc的文件属性查看内容没有变化,从属性检验不能反映出剪辑编辑的痕迹特征。—62—(三)剪辑编辑音频文件的波形研究及结果波形分析是对录音信号的振幅与时间的变化关系进行分析的检验方法,波形分析能够展示录音信号随时间的细微变化,也帮助分析一些特殊信号产生的原因。整个录音过程当中,有些特殊信号是录音过程当中的外部噪音,或者操作噪音、设备的本底噪音以及剪辑编辑所带来的一些特殊特性的波形。波形分析有助于判断录音所用设备及录音的形成过程,是录音资料真实性(完整性)鉴定中的一个重要方法。录音拼接剪辑中,剪辑人先在需要编辑的音频文件中把不需要的语音剪切掉,然后把需要的语音粘贴到这个部位,用于粘贴的这个语料主要有三个来源:第一是取自于同一人的语音的相同音频文件当中的相同音节或句子;第二是来自于同一人的语音的相同信道不同时间录制的音频文胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究件,把当中所需要的音节或句子复制以后粘贴到所需要拼接的部位;第三个来源是同一人的语音的不同的信道在不同时间录制的音频文件,把当中所需要的音节或句子复制以后粘贴到所需要拼接的文件中。第一种来源的语料编辑的文件,通过波形的细节分析会发现音节原样重复特征。第二种虽然信道相同,但是不同时间录制的音频文件,其背景本底波形特征可能有差异。音节或句子的波形总体上会和前后句子的波形有差异,因为同一个(1)波形总体分析打开音频文件的波形图,显示为完整句子的范围,可以看到,总体波形的振幅能量有异常,在被粘贴的句子部位振幅的大小明显的比周围的音节要低。如下图2.2所示。人每次说相同音节无论韵律、音量大小、发音时长等表现是不一样的。第三种语料的来源由于信道不相同,其设备的本底及信道特性可能不同,产生波形特征的差异。另外,无论是经过哪一种剪辑编辑的音段,在听觉检验当中一般都可以听出音高、发音的个体习惯动作活动、声音综合品质、韵律、响度等听觉异常。用AdobeAuditionCS6软件打开经剪辑编辑得到(X6)的署名为“H1X12(X1).mp3、H6X12文件。.它们都是用上述第m4a、H9X12(X9)12.种信道来源的语料aac”这三个音频进行剪辑编辑的文件。即粘贴来自于同一人用不同的信道在不同时间录制的音频文件当中的语料。以打开署名为“H1X12(X1).mp3”的文件为例,工作窗口见如下示意图2.1。通过查看频谱图发现粘贴的语料其频率响应范围与周围的音节差异很大,能量也有明显的差异。图2.1 文件“H1X12(X1).mp3”用AdobeAuditionCS6软件打开的窄带频谱图“Windows用联想(昭阳)E49A笔记本电脑并用的数字语音文件Media,Player”将音频信号通过调音台软件播放上述经过编辑、外置声卡输入VS-99(4.0)语音工作站。采集后的音频文件保存为16位WAVPCM格式。波形分析结果如下究及结果1.署名为。“H1X12(X1).mp3的波形研图2.2 文件“H1X12(X1).mp3”的总体波形图(2)在音节音节波形的完整性分析“我”的末端,波形没有渐变,发音结束急促2.3所示。,显示出剪切的波形痕迹。如下图图2.3 音节“我”的末端波形没有渐变(3)通过纵向放大显示剪切粘贴的音节其背景噪背景波形分析音的总体振幅能量比其前后音节要小,说明粘贴语料的背景噪音水平比原音频文件要低。背景噪音显示出突变的现象,句子中存在不同来源的语音材料。如下图2.4所示。图2.4 粘贴语料的背景噪音水平比原音频文件要低究及结果2.署名为“H6X12(X6).m4a”的波形研(1)波形总体分析—63—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究打开音频文件的波形图,显示为完整句子的范围,可以看到,总体波形的振幅能量没有太大的异常,在被粘贴的句子部位振幅的大小与其后面的音节差不多。如下图2.5所示。(1)波形总体分析打开音频文件的波形图,显示为完整句子的范围,可以看到,总体波形的振幅能量有异常,在被粘贴的句子部位振幅的大小比其后面的音节图2.5 文件“H6X12(X6).m4a”在被粘贴部位振幅的大小与其后面的音节差不多(2)粘贴语料在音节音节波形的完整性分析“我”的末端,和“还”始端之间,可以观察到“我”的末端波形没有渐变,听感发音结束急促,在音节“还”的始端显示出背景噪音有突变部位,在这两个部位发现剪切的痕迹。如下图2.6所示。图2.6 波形显示出有剪切的痕迹(3)通过纵向放大显示剪切粘贴的音节其背景噪背景波形分析音的总体振幅能量比其前后音节要小,说明粘贴语料的背景噪音水平比原音频文件要低。背景噪音显示出突变的现象,句子中存在不同来源的语音材料。如下图2.7所示。图2.7 粘贴语料的背景噪音水平比原音频文件低及结果3.署名为“H9X12(X9).aac的波形研究—64—小。如下图2.8所示。图2.8 被粘贴的句子部位振幅比其后面的音节小(2)粘贴语料在音节音节波形的完整性分析“我”的末端,和“还”始端,可以观察到“我”的末端波形没有渐变,听感发音结束急促,在音节“还”的始端显示出背景噪音有突变部位,在这两个部位发现剪切的波形痕迹。如下图2.9所示。图2.9 音节“我”的末端,和“还”的始端有剪切的波形痕迹(3)通过纵向放大显示剪切粘贴的音节其背景噪背景波形分析音的总体振幅能量比其前后音节要小,说明粘贴语料的背景噪音水平比原音频文件要低。背景噪音显示出突变的现象,句子中存在不同来源的语音材料。如下图2.10所示。图2.10 粘贴语料的背景噪音水平比原音频文件低在录音资料真实性的真实性鉴定当中,波形胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究信号的突变是十分关注的现象,在录音材料当中,都有可能出现一些信号的突变,借助于波形分析展示录音信号随时间的细微变化,分析其形成的原因。在模拟录音设备所录制的正常录音资料或剪辑录音资料,都会涉及到分析录音设备的操作信号波形特征,例如停止、暂停、结束等操作特殊信号波形。对于分析不同录音设备波形分析是非常有力的一个手段。数字录音资料也有各种各样的特殊型号,这些特殊信号有设备本身及操作带来的,也有话者频率响应是衡量一个录音系统声音还原能力的重要指标,不同录音系统其频率响应范围有很大的差别,例如,座机电话的录音系统其响应频率只能达到3.5KHZ,而现在的中高档录音笔、手机频率响应超过4KHZ甚至于达到6KHZ。通过宽带语图研究可以大致了解一个录音信道特点并分析整个录音中频率响应是否保持一致。如果不一致,说明整个音频文件当中有来自不同信道的语料拼接。将经过剪辑编辑的语音文件“H1X12(X1)发音动作所造成的,也有来自于背景、环境的特殊信号。从上述实验结果我们看到,在语音剪辑编辑检验当中,能够发现检材波形的总体异常,在波形细节方面音节的不完整以及背景波形的异常,从这些方面都可以发现剪辑编辑的痕迹。例如在文件“H9X12(X9).aac”的波形分析中,在音节“我”的末端,和“还”始端,可以观察波形突变,在这两个部位发现剪切的波形痕迹特征。(频谱分析是借助频谱分析软件或设备四)剪辑编辑痕迹检验中的频谱分析,对录音信号的能量随频率的分布关系进行分析检验的。频谱分析是一种频域分析方法,能够以时域分析不同的角度揭示录音信号的特点,用于分析信道特性、特殊信号特点、语音的连续性、设备的本地噪音等。是录音资料真实性鉴定的一种十分重要的检验方法。频谱分析有二维和三维频谱两种,二维频谱又称功率谱,按分析时长分为即时功率谱、区间功率谱长时功率谱。三维频谱除显示信号能量与频率的分布关系外,同时显示频谱随时间的动态变化。按分析带宽的区别三维频谱有宽带语图和窄带语图。宽带语图频率分辨率低,但是时间分辨率高,能够较好的显示频谱分布随时间的动态变化。窄带语图时间分辨率低,但频率分辨率高,能够准确显示能量随频率的分布关系1.。宽带语图能够较好的表现频谱随时间的动态宽带语图分析变化。信号对于时间响应快,所以可用于特殊信号分析,背景、设备(信道)等噪音分析。对署名.为“H1X12(X1宽带语图研究其剪辑编辑的痕迹特征m4a、H9X12(X9).aac”).mp3、这三个音频文件用H6X12(X6)(1)信道特性研究。..mp3、三个文件在经过粘贴部位aac”在H6X12IV-12语音工作站中打开(X6).m4a、H9X12(X9),粘贴语料的频率响应,可以观察到明显低于周围的音节,高频部分有明显差别。三个文件的宽带语图如下图2.11所示,显示出粘贴部位高频整体异常。暴露出拼接的痕迹。自上而H6X12下分件宽带语图(别X6)是署。.m4a、名为H9X12“H1X12(X9)(X1.aac”).mp3、的文图2.11 自上而下分别为署名为“H1X12(X1).mp3、H6X12(X6)文件宽带语图.m4a、H9X12(X9).aac”的(2)在一般正常谈话当中音节的连续性和完整性,话者表述的句子应该是完整连续的,这是从反映的句意方面来说。通过听觉鉴别话者谈话主题是否保持一致,整个句子及其前后句子是否具有逻辑关联,谈话是否完整。从分析频谱这个细节角度,每一个音节的宽带语图应该是完整的,音节之间连续过渡。如果音频文件经过剪辑篡改,由于当今一般编辑软件技术方面存在局限性,制作人在操作软件的过程—65—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究中本身也具有听觉视觉的局限性,例如通用的编辑软件只能显示波形图和窄带频谱图,虽然波形显示精度是非常高的,达到1/1000秒,但是频谱图在显示能量和频率方面精度并不高。再加上制作人的局限,在剪切或粘贴语料的过程中,无法准确控制剪切的位置,能量控制方面可以调整增益、衰减或降噪,但也不可能调整到与被编辑的文件一模一样的状态。再加上听觉的局限,剪辑以后很难消除韵律特征异常。所以通过系统检验总会发现剪辑编辑的痕迹。通过宽带语图研究图2.13 拼接音节观察到剪辑对声门脉冲规律的破坏②剪切遗漏发现有以下几种剪辑编辑特征痕迹①。制作一个剪辑编辑的文件音节不完整,最关键需要是切除一些音节,而粘贴入一些需要的音节。由于每一个音节的始端和末端能量都是逐渐变化的,在剪切音节的过程当中,由于不能准确地把握时间点以及能量部位,就会造成一个能量的突变点,如果剪切是发生在某个音节的始端或者末端,就可能会造成音节在这两个部位的不完整2.语图在剪切部位的局部图12是音频文件“H1X12。如下图,(X1)可以看到句子.mp3”的宽带“18万”末端,音节能量有突变,音节不完整。图2.12 文件“H1X12(X1).mp3”在剪切部位能量有突变,音节不完整。音节不完整还表现在一个特定的音节经过拼接以后形成一段语音,这个经过拼接的音节,在宽带语图分析当中可能会显示出声门脉冲的异常。因为正常发音中声带是有规律振动的,声门脉冲基本上呈周期性的连续变化,经过拼接的音节,由于不可能准确拼接,拼接部位的声门波间隔与两边相比显示出扩大或者缩小,与其两边的脉冲规律明显不同,反映出剪辑编辑的痕迹特征。下图2.13是一个拼接音节的宽带语图,将时间精度提高以后,可以观察到剪辑对声门脉冲规律的破坏。—66—根据上述分析指出当今一般编辑软件技术方面存在局限性和制作人在操作软件的过程中本身也具有听觉视觉的局限性因而制作人在剪切或粘贴语料的过程中,无法准确控制剪切的位置,所以通过宽带语图会发现剪辑编辑特征痕迹,例如出现剪切遗漏。即本来该完全剪掉的音节,在波形图上音节始端末端的渐变能量没有完全剪掉,产生剪切遗漏痕迹。如下图2.14所示是语音文件“H9X12(X9).aac”句子“18万我已经还你了”中剪掉音节“了”产生剪切遗漏,因为句子“你了”连读速度快,两个音节之间有连续渐变关系,制作人控制不了在音素之间精确的剪切,所以留下音节“了”的末端部份发音。通过听觉仔细辨听也发现了这个遗漏的发音部分。图2.14 语音文件“H9X12(X9).aac”被剪掉音节“了”产生剪切遗漏③前面谈到录音拼接剪辑中原样重复,剪辑人先在需要编辑的音频文件中把不需要的语音剪切掉,然后把需要的语音粘贴到这个部位,用于粘贴的这个语料来自于三个来源其中第一是取自于要剪辑处理的相同音频文件当中的同一人所说的相同音节或句子。对整个音频文件通过听辨和波形图、宽带语图细节分析,会发现频谱特性一模一样的音段。一个人每次发音都有差异,同一个内容相同的句子,同一人两次发音,从时间、频率和能量胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究三维特性都表现得一模一样是不可能。2.窄带语图和功率谱分析窄带语图和功率谱都能够精确的显示被分析信号的能量随频率分布的情况,可用于语音、特殊信号、背景、信道特征的分析。(1)窄带语图中发现剪辑编辑的痕迹一个语音文件经过剪辑编辑,宏观方面其总体背景、音节的频率、能量可能会表现出现异常。从细节方面分析窄带频谱图也必然存在上述在宽带语图中发现的音节不完整、剪切遗漏等特图2.16 音频文件“H9X12(X9).aac”的能量曲线在上述文件窄带图谱中,在句末音节“你”征。下图2.15自上而下依次是经过剪辑编辑的文.以明显地看到m4a、件“H9X12H1X12,(X9)(X1).mp3、H6X12(X6)在粘贴的部位.aac”的窄带全貌图,这个贴入的语料。可其频率响应低于原文件,有很大的差异。另外,由于这个粘贴语料的背景噪音能量低于原文件的背景噪音能量,所以在贴入的音节两端的背景能量与原文件的整体背景相比表现出两条浅灰色的直条带。图2.15 自上而下依次是三个文件的窄带全貌图从窄带音节的细节方面来看,由于一个音节始端和末端都是渐变的,从窄带三维频谱图来观察发现被剪切后粘贴部分,影响了其前邻和后邻的音节,造成音节不完整,在剪切粘贴部位前邻音节末端和后邻音节始端渐变部分被剪切,造成在这个时间点的发音表现出能量台阶。(X9)如下图2.16所示为音频文件“量出现如断崖式的衰减.aac”的能量曲线,。H9X12这在一个人发音过程当可以看到在剪切点能中是不可能的。的末端,剪切痕迹右边能量曲线呈现出渐变过程“图了,结合听辨和观察窄带频谱图,发现这是音节2.”17被剪切不完整显示其剪切遗漏的窄带细节,其末端有遗漏发音部分。。图2.17 剪切遗漏的窄带细节(2)①10信道特性分析从上述的三个剪辑编辑实验文件宽带图或窄种信道的本底噪音频率响应特性研究带图,都可以明显发现来自不同信道的粘贴语料,其频响特性和原文件是不一样的,频响范围明显的低于原文件。信道特性的差异有三个方面的表现,一是频响范围;二是背景能量水平;三是背景频谱特性。不同信道的这些特性是不一样的,如果把来自不同信道的语料进行复制粘贴,在这三个特性方面可能明显表现出信道的差异,从而发现剪辑编辑的痕迹。实验研究了10名话者各自使用的手机本底噪音长时平均功率谱,发现每一部手机的本底频谱特性基本都是不一样的,说明可以用设备本底频谱特性来区别不同的特定信道。所以通过研究宽带和窄带语图可以评估一个信道对语音的频响特性,通过测量设备本底的长时平均功率谱可以分析不同信道的频率响应特性和能量特性。在上—67—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究述三个特性方面分析信道的差异,从而发现剪辑编辑的痕迹。以下图2.18自上而下分别是话者H1-H5及其5部手机的本底长时平均功率谱FFT的测量结果,图2-19自上而下分别是话者H6-H10及其5部手机的本底长时平均功率谱FFT的测量结果。信道X1的台阶状响应能量水平大致为20dB;信道X4的台阶状响应能量水平大致为28-45dB;信道X6的台阶状响应能量水平大致为46-55dB;信道X8的台阶状响应能量水平大致为40dB;信道X9的台阶状响应能量水平大致为33-51dB;信道X10的台阶状响应能量水平大致为28-48dB。第二种低响应模式,表现在X2、X7这两种信道。X2在频率0-1800HZ的范围频响有一个46dB的峰值,然后以后的各频率响应基本保持在18dB图2.18 话者H1-H5(从上到下)及其5部手机的本底长时平均功率谱FFT的测量结果图2.19 话者H6-H10(从上到下)及其5部手机的本底长时平均功率谱FFT的测量结果从以上结果发现10部手机当中总共有三种频率响应模式。X8、第一种台阶模式率响应模式相同X9、X10这六种信道,表现在X1、X4、X6、,但频率响应的表现特征不一。它们的本底噪音频样。但其中信道X9、X10的频谱特性几乎一致,15dB。响应频率在15700-16100HZ急剧下降到13-到12dB。信道信道X4的响应频率在X6的响应频率在5840HZ13450HZ急剧下降急剧下降到15dB。信道X8的响应频率在20070HZ急剧下降到20000HZ19dB。信道其他信6400HZ道急剧下降到X1的总体响应频率在一样一直保17dB,持类似但之前并未如上述台阶的降到约19dB有一个的水平38dB,的峰值以后表现为缓升的台阶状,然后在8150HZ状态,在下直到20000HZ的急剧下降点。—68—以下的水平。X7从开始频率到200HZ有一个70dB的峰值,在4000-5000HZ有一个40dB的峰值,然后下降再缓升到26dB,在20000HZ急降,然后保持在20dB的水平。频率响应特性与第一种模式类似,只是X7的总体响应频率低。第三种下凹状的响应模式,表现在X3、X5这两种信道。X3在频率7580-15030HZ之间有一个类似下凹状而底部呈平态(响应能量水平约10dB)的响应特性。X5也有类似的表现模式,只是在下凹部位随频率增加响应能量水平急剧下降和上升表现得没有X3那么剧烈。总体形式二者类似。X10综合以上结果,实验的10个信道除响特性是有差别的的频响特性类似以外,通过测量频响曲线变化的特,8个信道本底噪音频X9、征点参数发现它们有差异。所以检验信道本底噪音频率响应特性可以作为检验数字音频文件是否经过剪辑编辑的必要条件均功率谱②三个剪辑编辑实验语音资料的信道长时平。FFT特性研究H6X12我们个实验音频文件的粘贴部分语料设备本底噪音的(X6)做出.署m4a、名为H9X12“H1X12(X9)(X1.aac”).mp3、的三长H6X6.时平均功率谱,和署名为“H1X1.平均功率谱相比较m4a、H9X9.,aac”mp3、研究二者是否有差异的三个原文件背景长时。通过窄带语图尽量找出干扰较少的背景,做出二者背景的长时平均功率谱FFT。以下是原音频文件背景噪音功率谱与粘贴音节的背景噪音功率谱进行比较的结果示意图。上图为贴入的音段背景噪音功率谱,下图为原文件本底噪音功率谱。结果发现二者差异非常大。一是音频文件“H1X12(X1).mp3”中的粘贴语料和原文件的背景FFT比较结果。音频文件“H1X12(X1).mp3”中的粘贴胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究语料和原文件的背景FFT比较结果如下图2.20所示。图中上面的曲线是粘贴语料的背景长时平均功率谱FFT,结果表明在开始频率70HZ左右,功率由50dB剧烈的下降到30dB,然后基本保持类似一个台阶状的在40dB左右的功率水平。然后在约4200HZ有一个激烈的下降,然后保持在约10-20dB的较低水平范围。图中下面曲线是音频文件H1X1.mp3的背景长时平均功率谱FFT。可以看到,其表现的形式和粘贴语料的背景是不一样的。在开始阶段约图2.21 “H6X12(X6).m4a”中的粘贴语料(上)和原文件(下)的背景FFT比较三是音频文件“H9X12(X9).aac”中的250HZ降,在有一7400HZ个70dB左右大致保持左右的峰30dB值,然左右类似于后逐渐下一个平台的功率谱曲线形态20000HZ。然后在约18000-20dB的变化形态功率谱急剧下降。,最后功率保持在10-图2.20 “H1X12(X1).mp3”中的粘贴语料(上)和原文件的背景(下)FFT比较二是音频文件“H6X12(X6).m4a”中的粘贴语料和原文件的背景FFT比较结果。音频文件“H6X12(X6).m4a”中的粘贴语料和原文件的背景FFT比较结果如下图2.21所示。图中上面曲线是粘贴语料的背景长时平均功率谱FFT,结果表明在开始频率70HZ左右,功率由50dB剧烈的下降到30dB,然后基本保持类似一个台阶状的在40dB左右的功率水平。然后在约4200HZ有一个激烈的下降,然后保持在约10-20dB的较低水平范围。图中下面曲线是音频文件H6X6BJ.m4a的背景长时平均功率谱FFT。可以看到,其表现的形式和粘贴语料的背景是不一样的70dB左右类似于一个平台的功率谱曲线形态逐渐下降,在约6200HZ左右大致保持。在开始阶段由。然后在40dB约10800功率谱急剧下降,在13100HZ呈断崖式下降,最后功率保持在15-20dB的变化状态。粘贴语料和原文件的背景FFT比较结果。音频文件“H9X12(X9).aac”中的粘贴语料和原文件的背景FFT比较结果如下图2-24所示。图中上面曲线是粘贴语料的背景长时平均功率谱FFT(A),结果表明在开始频率70HZ左右,功率由50dB剧烈的下降到30dB,然后基本保持类似一个台阶状的在40dB左右的功率水平。然后在约4200HZ有一个激烈的下降,然后保持在约10-20dB的较低水平范围。图中下面曲线是音频文件H9X9BJ.aac的背景长时平均功率谱FFT(A)。可以看到,其表现的形式和粘贴语料的背景是不一样的。在开始阶段由65dB逐渐下降,在约2000HZ左右大致保持35-45dB左右类似于一个平台的功率谱曲线形态。然后在约15600HZ呈断崖式下降,最后功率保持在15-18dB的变化状态。图2.22 “H9X12(X9).aac”中的粘贴语料(上)和原文件(下)的背景FFT比较通过上述的实验结果,反映出不同信道本底噪音的频率响应特性是不同的,在相同的录音噪音背景下,如果信道相同,录音文件应有大致相同的本底噪音频率响应特性,通过测量本底背景噪音的长时平均功率谱FFT曲线,可以反映出该音频文件的特定信道本底噪音特性。如果一个音频文件被剪切了一个音段然后粘贴入来自不同信道的另外一个音段,由于两个源文件的信道的本底噪音频率响应特性不同,可能就会显示出长—69—胡健松,殷启新,陈丁文:语音资料真实性(完整性)的系统鉴定研究时平均功率谱FFT的差异,从而发现有剪辑编辑的痕迹。所以检验信道本底噪音频率响应特性可以作为检验数字音频文件是否经过剪辑编辑的必要条件。三、结果与讨论从上述结果发现检验数字音频文件是否经过剪辑编辑是一个系统工作,无论现代音频编辑手段有么的方便有效,但是通过音频文件元数据分析、听觉检验、波形分析和频谱分析的系统检验手段(三)波形分析是宏观检验中的一个有力波形分析是对录音信号的振幅与时间的变化关系进行分析的检验方法,用于分析特殊信号、总体振幅是否异常、音节是否完整和背景波形是否异常。波形分析能够展示录音信号随时间的细微变化,也帮助分析一些特殊信号产生的原因。整个录音过程当中,有些特殊信号是录音过程当中的外部噪音,或者操作噪音、设备的本底噪音以及剪辑编辑所带来的一些特殊特性的波形。波不难发现剪辑编辑的痕迹特征,这些痕迹特征表现有的可以作为发现剪辑编辑的必要条件,有的可作为充分条件,综合评断才可以得到明确的结论。验方法(一)听觉检验是一种有效而重要的主观检通过听觉检验可以发现超音段特征。将其归纳为九类十多项指标。九个超音段特征是音高、发音、声音的综合品质、韵律、响度、言语技能、方言口音、社会方言、话者情态。这种方法,最大的问题是,怎么把这些指标研究得更精细,量化工作做得更具有科学性,准确反映一个音频文件是否有异常,是否经过剪辑编辑。在实际工作中,就听觉感知而言,发现音频文件的异常是非常有效的从宏观上发现剪辑编辑的痕迹(二)音频文件的属性或元数据分析。,可以音频文件的属性是具有一个广泛内容的概念,包括格式信息和和数字录音的生成相关的信息。例如,时间属性、文件名属性、音频文件的参数、文件的数字结构信息和附加信息等等。一个数字音频文件是由特定的录音设备所生成的,其采集、数字编码和音频参数等都包含有特定设备的信息。本研究工作,通过软件研究音频文件的属性信息,发现只要经过篡改,必然在属性信息当中就会反映出篡改的痕迹。但是有些设备录制的特定格式的音频文件(例如,aac格式)通过查看属性信息不能发现篡改痕迹。—70—形分析有助于判断录音所用设备及录音的形成过程,是录音资料真实性(完整性)鉴定中的一个重要方法整性()四鉴定的重要检验方法)频谱分析是数字录音资料真实性。(完频谱分析能够以时域分析不同的角度揭示录音信号的特点,例如宽带语图和窄带语图分析,用于分析信道特性、特殊信号特点、语音的连续性、设备的本地噪音等。从鉴定技术的角度来说专业的频谱分析软件是检验数字音频文件的真实性(完整性)的基础和技术标准。如果没有功能软件“阳宸VS-99(4.0)计算机语音工作站,阳宸IV-12智能语音工作站V8.0”,要开展数字音频文件的检验鉴定研究工作是不可能的。一般市场上流通的音频编辑处理软件,注重的是波形的分析处理,在时域方面精度很高,但是很难做到精确的频域分析和能量的分析控制。所以,经过市场上流通的音频处理软件剪辑编辑的语音资料,多少都会留下剪辑编辑的缺陷,通过系统检验可以发现剪辑编辑痕迹。即使对数字音频文件的剪辑编辑工作在时域和频域方面做得几近完美,但是通过听觉发现超音段特征的差异方面可能是无法避免的,因为剪辑编辑是用不同时间空间形成的语料来剪切或者粘贴,话者发相同的音节或句子时,语境不同其超音段特征必然表现出差异。(编辑 高 翔)


发布者:admin,转转请注明出处:http://www.yc00.com/num/1702181440a1184084.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信