ISIbase使用简介

ISIbase使用简介


2024年6月19日发(作者:)

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

化学数据交流和化学软件使用说明

1.化学数据文件格式

2.ISIS/Base软件介绍及其使用详解

1)软件介绍

2)建立数据库

3)修改数据库定义

4)输入数据

5)数据交换

I)SDF文件

II)Excel文件

III)Table(txt)文件

6)数据检索

7)对象(Object)管理

8)插件工具(Add-in)使用

3.ISIS for Excel 2000

4.其他化学软件介绍

1/20

孙传涛

2003-12-27

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

S.0. ISIS/Base软件简介

ISIS/Base是MDL

®

公司的化学数据库软件。当前最高版本是2.5,我们公司所使用的是2.4版。

其上可以安装SAR Table(构效关系表),AutoNom(自动命名)等插件工具(Add-in)(对它们的

介绍见后文),前者可将数据库中的数据导出到Excel表格,可用于构效关系研究、与其他应用程

序进行数据交换;后者可用来自动命名库中的全部结构。图1为ISIS/Base界面。在“对象选择板”

上并列着四个按钮:Forms,Query,Browse和Update。它们的意义和功能分别如下:

1) Forms:设计人与数据库打交道的界面

2) Query:输入查询数据进行检索

3) Browse:浏览检索结果(即数据库中的数据),见图1.1

4) Update:数据更新,包括记录的添加、删除和修改

Menu(菜单)

Transfer

to Draw

对象(Object)

选择板

检索范围

当前纪录顺序号

库中全部记录数目

导航/工具板 Forms区

图1 ISIS/Base界面

对象选择板:选择Forms/Query/Browse/Update界面

检索域:显示记录的检索范围

导航/工具板:察看或定位记录(Query、Browse和Update)、提供绘制工具(Forms)

Forms区:用户与数据库打交道的界面,通过这个界面更新、显示记录

数据浏览按钮

到第一个记录

上一个记录

到指定记录

下一个记录

最后一个记录

输出到Excel表

格文件

自动命名插件

图1.1 Browse界面

注:考虑到数据和系统安全的问题,公司内部的计算机用户对大部分系统文件和目录没有修改的权

限,但本软件要求对部分文件和目录可以改写,否则一些功能不能实现,比如Add-in使用(如输

出到Excel表格文件、自动命名)、设置保存等,我们可以要求IT部门修改这些目录和文件的权限,

2/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

因为它们对整个系统的安全和稳定性通常并无有害影响,这些文件和目录分别是:

 ISIS BASE软件的安装目录,比如“C:Program FilesISIS 2.4”

 WINNT下的3个ini文件:,和。

S.1. 化学数据文件格式

单机版化学结构数据库

.DB: MDL ISIS/Base数据库

➢ 此种格式只能使用ISIS/Base软件打开和操作,而且不能远程(Remote)操作。

四种标准的化学结构数据文件格式:

.MOL:MDL mol文件(单个结构)

.RXN:单个反应(一个反应只能有一个试剂和一个产物)

.SD或 .SDF:结构数据文件(包含一系列结构)

.RD:反应数据文件(包含一系列反应)

➢ 此四种格式都是文本文件,可用文本编辑器如Notepad、写字板等打开和编辑,mol

文件则可以由ISIS/Draw或ChemDraw等多数化学软件编辑和保存,是一种标准的存

储化学结构的格式。每一种文件都有自己固定的数据标志,比如MOL文件,用于记

录一个化学结构(不包括格式、文本,此化学结构中可有多个结构片断),以“M END”

字符串加一回车换行符作为结束标志。SD文件如果包含化学结构,则在每条记录的

最前部输出,格式完全同MOL文本,随后是其他各项数据。数据项名(Field Name)

以“> <”起始,以“>”结束(有时后面紧接着圆括号扩起来的ID号),下一行直

到下一个数据项名之前是其数据内容,这是我们最关心的东西。如果数据库中某一数

据项没有数据,则此项不会输出。每条记录以“$$$$” 字符串加一回车换行符作为

结束标志。

其他格式:

.cdx,.cdxml:ChemDraw软件支持的文件,容纳的信息非常多而且全面

.doc,.pdf:可容纳信息相当多,但对于化学结构和数据处理常常让人叹气

.XLS:Microsoft Excel电子表格文件

.txt:以“Tab”(制表符)键为分隔符的表格(Table)文件

➢ .txt文件就是一般的文本文件,只不过有个特别的格式:存放各个数据项(Field,或

Excel电子表格中的Column),每列数据项之间以制表符分隔。此时我们称之为“表

格(Table)”文件。它不能够存储化学结构,但处理和交流其他数据则很方便,也是

很通用的格式。

我们平时最为常用的是DB、SDF和txt文件格式,它们可以非常容易的被其他程序(如化学

计算软件)操作,也是大多数化学、制药公司进行化学结构和相关数据交流的最主要格式,尤其是

SD文件,如果用于化学计算,则必不可少。本说明手册主要涉及到此三种文件格式。我们此处所

说的“操作”常常指“批量操作”,不是对一个化学结构及其数据,而是一批结构和数据。对于单

个结构和数据的保存和交流,可以使用任意格式。

3/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

S.2. 建立数据库(New Database)

Parent: Root

数据项名称

(Field Name)

添加新的数据项

(Field)

修改已有的数据项名

称、类型、外部名称等

用于定长文本

(Fixed Text)

删除已有的数据项

图2 创建数据库,定义数据项

S.2.1. 建立一个完全新的空数据库

1)定义数据库的组织结构(definition)

点击菜单FileNew Database,输入文件名,然后向库中添加各个数据项定义(Field

Name)(如图2所示),以构成数据库的数据组织结构和方式(即用于存放数据的“容器”)。一

般要求各数据项应当按照其本身的性质决定赋予哪种数据类型,比如数字一般用整数(Integer)

或实数型(Real),文本使用固定长度文本(Fixed Text)或不定长文本(Variable Text),化学结

构则使用Structure类型。这样便于以后的数据交流和处理。

注意:化学结构(Structure)必须赋予一个外部名称(External Name),*structure,(图

2中红线框起来的部分)才能将结构导出(Export)到SD文件或者从SD文件导入(Import)。

除此以外的其他各项最好不要填External Name,将其空着。

建议:我们为数据项取名时,应遵循“简短、达意”的原则。

俟全部定义完成之后,点击“Save”按钮,即可保存。如果希望添加、修改或删除其中的

某项定义,参见S.3.节。

2)设计交互界面(Form),图3

创建数据库之后还不能马上向库中加入新的数据,必须建立一个可以与数据库打交道的界

面(Interface,Form)。在“对象选择板”上点“Forms”进入Forms界面,设计、绘制表单(Form)。

Box和Table用于容纳数据(可以是库中的数据,亦可以是它们经过运算后的结果),前者只能

容纳一条数据,后者可以是一个记录的全部子记录,或者数据库中的全部数据。每个Box有两

项组成:标题(Label)和对应数据项名称(Field Name),前者可以任意填写,但应该达意;

后者则必须是对应的Field Name。双击Box或Table时则可以定制,包括数据对应、格式、结

4/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

构显示方式等。请尽量设计的美观、专业和方便使用。然后保存,点击菜单FileSave Form

或Save Form As…,这样就能够通过这个界面在数据库中查询、浏览和更新数据。如果希望将

此Form保存到外部文件,用于定制其他数据库的Form,点击菜单FileExport(导出)Form,

填入文件名即可。如果希望使用已有的Form作为模版,则点击菜单FileImport(导入)

Form,然后双击各个Box进行定制,完成后不要忘记Save Form(菜单FileSave Form)。

Label,可以随便

改写,但应达意

Field Name,必须与库中

的对应FieldName完全

相同,不能随便改动

工具栏

选择

绘制Box

绘制Table

画线

输入文本(Text)

Box

没有Label,只

有Field Name

文本(Text)

图3. 建立Form

S.2.2 以已经存在的数据库为模板,建立一个空的数据库(与已存在的数据库组织结构完全相

同,但不含数据)。

首先打开模板数据库(其数据项已定义好),然后点击菜单FileNew Database,此时出

现的创建数据库对话框中显示出模板数据库的数据项定义,在此处可以按照自己的要求修改、

添加或删除数据项定义。进入Forms,可以重新设计一个Form,也可以从模板数据库或其他数

据库中加载一个Form,方法是:首先从模板数据库导出Form文件,然后在这个库中将其导入,

并在使用数据库之前保存此Form(参见上一节)。

重要建议

a) 建立了一个空的数据库之后,最好在向其输入数据之前做一copy以备将来再次使用;

b) 每次修改数据库时,不论是数据项定义还是数据的操作,比如删、改、导入数据(尤

其是批量的导入数据时),如果不能有100%的把握不出错误,则在动手之前先将原数

据库备份(做一个copy),待操作完成并复查无误后方可删除。切记:ISIS/Base中的

所有数据操作不可恢复或undo,需精神集中和小心才可避免无法挽回的错误。数据

库可以重建,但数据不是任何时候都能再找回的。

5/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

S.3. 修改数据库的数据项定义

比如向库中添加、删除数据项或修改名称、外部名称(External Name)和父结构(Parent)。

进入Browse界面,点击菜单DatabaseEdit Definition…,弹出“Edit Database Definition”对

话框,从中可对各数据项定义进行修改、增加或删除。如果只修改外部名称,则可点击菜单

DatabaseView Definition…,点击按钮“Modify External Name…”。如果一个数据库不能输

出化学结构,则需要修改这一项。

注意:不能修改已存在的数据项的数据类型(Type)。但如果数据库刚建好,还未有数据

更新,则数据类型(Type)可以修改(重新选择后点击Edit按钮),否则必须先删除此项,保

存后再进入此界面,重新输入Field Name和选择Type后,点击“Add”按钮即可。

S.4. 输入数据(添加记录)

首先进入Update界面。除了第一条记录,添加新的记录时,必须点击菜单EditNew

Record,或者按快捷键Ctrl K,然后输入数据。输入结构时需要注意,如果库中已经有这个结

构,则会出现重复结构(duplicate structure)的提示,此时可以不输入或者检查是否输入错误。

数据库中的重复结构将会给后续的数据处理带来很大的麻烦;当然如果事先的规则允许库中有

重复结构不在此列。

输入化学结构时,双击“Structure” Box(或者点击ISIS/Base左上角的“Transfer to Draw”

按钮

按钮

)打开ISIS/Draw应用程序,画完结构后,点击ISIS/Draw左上角的“ISIS/Base Transfer”

,即可退回数据库并更新结构。亦可从其他应用程序中(比如ChemDraw等)向ISIS/Base

粘贴已画好的结构。

建议:

1.输入数据时,要注意数据的规整性,比如,在文本类型的数据中,尽量避免空格、回

车换行、制表符(TAB)等字符,区分横线(减号)和下划线。数据如果不规整,将会给以后

的检索和数据处理带来意想不到的问题。

2.输入化学结构时,需要注意一些官能团简称(Atom Alias,Super Atom或Group)的使

用,比如COOH,CN,Me,Et,NO

2

,Boc等,在ISIS/Draw中可以输入COOH、NO

2

、OCH3

(OMe)、CN等简称,并能被程序正确处理,除此以外大都不能正确处理(称为“不认识的元

素符号”);在ChemDraw中大部分能够正确识别,并且在粘贴到ISIS/Base或ISIS/Draw后也不

会出错。但如果对某个简称你不能肯定,则应将其展开成完整的化学结构(在ChemDraw中,

选择整个结构,点击菜单StructureExpand Label)。在数据库中,化学结构一旦出现错误,

纠正起来将会花费无法估计的时间和精力,极端的情况是必须一个一个的核对。为了自己和他

人的幸福,请不要图省事。

3.更新结构(从ISIS/Draw更新或从ChemDraw粘贴)时,注意各种警告提示,比如此结

构是否已存在于库中,是否有不认识的元素符号,等等。

S.5. 与其他ISIS/BASE数据库或其他应用程序交换数据

不论是其他应用程序还是大部分化学公司,或者用于化学计算,需要的化学结构和相应的

数据大都采用SD文件(sdf),还有的使用微软的Excel电子表格文件,但一般只要有前者,使

用特定的软件或方法,后者的制作轻而易举。

6/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

➢ 导出到SD/RD文件:在Browse界面下,点击菜单FileExportSDFile…,选择要

导出的数据项。前文已提到过,如果要导出、导入结构数据,则结构(Structure)项必须有外

部名字(External Name):*structure。导出RDFile的方法和过程与此相同。化合物的分子

式、分子量等由数据库计算的项目不能导出到此类文件。

如何确认结构已被输出呢?可以用文本编辑器(如Notepad、写字板等)打开sdf文件,察

看前面几行是否如下格式:

first_compound

StructureMaker 2D 1.00000

...

28 30 0 0 0 0 0 0 0 0999 V2000

-3.4776 -0.5871 0.0000 C 0 0 0 0 0 0

-3.4776 -1.8246 0.0000 C 0 0 0 0 0 0

-2.4058 -2.4434 0.0000 C 0 0 0 0 0 0

24 25 1 0 0 0

25 27 2 0 0 0

25 26 1 0 0 0

M END

如果有,则表示结构已被输出。

➢ 导出到Excel表格文件:将库中指定数据保存为Excel文件。在Browse界面下,点

击菜单FileSave Structure-Activity Table,或者点击左侧导航/工具板上的按钮,弹出一

个对话框,首先在Columns栏中选择要导出的数据项,然后在“Column Formats”栏中定义各

个Column的标题和格式,最后点击 “Export” 按钮即可。导出的xls文件可直接由Microsoft

Excel打开。注:分子式、分子量等数据可由此导出;但结构将会变为不能编辑、修改的图片

格式,再次使用时必须重新画一遍,因此原始数据库不可丢失。如果希望结构能够继续被修改、

交流或用于计算,则需要另外的软件“ISIS for Excel”, 参见S.10章节。

➢ 导出到本地数据库:将数据库中指定的记录(比如某次查询结果)保存到另外的一个

数据库(Local Database),此数据库的组织结构(数据项定义)、Form等与原库完全一样。在

Browse界面下,点击菜单FileExportLocal Database…,其他操作同上。

➢ 从SD文件导入化学结构和数据:在导入任何数据之前,首先保存一个原始数据库的

备份,以备导入过程中发生错误时可以恢复。在Update界面下点击菜单

FileImportSDFile…,选择要导入的SD文件,弹出一个选项对话框(Import SDFile),如

图4所示。上方左侧一栏(Duplicate ID Options)是发现文件中有重复ID时的处理选项,右侧

一栏(Duplicate Structure Options)是发现有重复结构时的处理选项(此项最为重要)。它们的

意义分别是:

 “Add a new record including structure”,不影响重复的数据,添加一个新的记录;

 “Merge new data”,在重复的记录中如果数据项不存在,则只将文件中的对应数据添

加进来,不影响已经存在的数据项;

 “Merge new data and overwrite existing data”,覆盖已经存在的数据项,添加不存在的

数据项;此选项要慎用;

 “Replace all data for this record”,覆盖全部的数据,如果原库中某数据项存在,而文

件中不存在,则将原库中的数据项清空,因此这项选择要慎用。

7/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

 “Skip data for this record”,跳过这条重复的记录;

 “Prompt”,弹出提示性的对话框,选择处理方式。

我们一般要求库中不能有重复的结构,当发现重复结构时最好记录下来是哪一个,以便导

入完成后检查,因此一般选择在“Duplicate Structure Options”中勾选“Prompt”。如果只是向

库中添加部分新的数据则可勾选“Merge new data”。“Duplicate ID Options”类推(一般选择第

一项“Add New…”。其他的选项可以使用缺省的设置。

图4,导入SD文件的选项

建议:我们可以用SD文件导出、导入的方法来检查已有的结构库中是否存在重复的结构。

一般来说,结构库输入完成后应该做这种检查。首先以此库为模板建立一个空的新库,并从模

板库中导入Form。然后将模板库的全部数据导出到SD文件,再将SD文件导入新库,在

“Duplicate Structure Options”中选择“Prompt”,当发现重复结构时报警,记下当前记录号(见

图1),将其加1即是重复的结构号码,全部导完后,检查这些结构;亦可根据需要选择其他选

项。

➢ 从Table文件(以制表符为分隔符的文本文件)导入数据:如果有了Excel表格文件

xls,我们可以将其中的非结构数据导入DB库中。先将Excel表格文件另存为制表符分隔的txt

文件(或者此文件已经存在)。此文件的格式一般是:第一行表示Field Name,第二行开始是

对应的数据。Field Name与数据库中的对应Field Name完全相同,否则需要在后面的步骤中进

行指定(assign)。然后在DB中进入“Update”界面,点击菜单FileImportTable…,出现

“Import Data from Table File”对话框,如图5.1所示。根据提示向下一步一步的进行。

8/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

图5.1

点击“Directions”即可告

诉你整个过程需要完成

哪些步骤

图5.2

选择待导入的Table文

件。

图5.3

指定分隔符(缺省的是第

一项“Tab”键)并预览

每一列数据。

9/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

图5.4

如果在Table文件的第一

行有Field Name,且与数

据库中的Field Name完

全对应相同,则会出现此

缺省的选项,否则要自己

指定第几行开始读取数

据。

指定Field Name

是否将此列数据输入库中

是否将此列数据作为库中已有数据的标志

前后翻页

图5.5

如果在Table文件的第一

行有Field Name,且与数

据库中的Field Name完

全对应相同,则会自动指

定每一列对应的Field

Name,否则要自己指定

第几列对应哪个Field

Name。注意左图中的文

字说明和两个红色、蓝色

椭圆处的对应关系。一般

我们只需要一个数据项

作为库中已有数据的标

志(link field),其他数据

只是输入(Register)数

据库。这在我们向库中已

有记录补充或修改数据

时非常有用。

10/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

图5.6

如果在库中发现已经存

在这条记录(根据上图中

link field来确认),可以

选择左图所示的操作。其

中要慎用“Overwrite”一

项,因为它将覆盖已有数

据。

Ask:提示

Skip:跳过,不输入

Merge:如果库中此项数

据为空则添加

Overwrite:覆盖已有的全

部数据

Create New Record:整个

记录作为新记录加入

图5.6

是否要求产生错误记录

和log文件。一般我们可

以不选,但如果导入的过

程发生错误,它们就会有

所帮助。

图5.6

输入前保存备份。为了在

出现问题时能够恢复原

来的数据库,最好在点击

“Begin Import”之前点

击“Backup Database”,

将把你的数据库做一备

份。然后就可以导入数据

了。

S.6. 在ISIS/Base中进行数据检索

11/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

ISIS/Base提供给我们的非常有力的一个工具是数据检索,尤其是结构检索。我们在搜索

MDL ACD,MDDR,CMC等或我们自己的ISIS/Base数据库时,就会遇到这个问题。我们应

当建立这样一个概念:使用数据库根本的就是查询(Search)。后面讲到的在Excel中获取

ISIS/Base数据库的数据亦是如此。点击菜单Search,弹出下拉菜单,如图6.1所示。

图6.1

上图中的下拉菜单各个项目的意义如下:

Set Search Domain to

Current List

Other List

Entire Database

By Form

Retrieve All

Query Builder…

SSS

Current Mol

View Last Query

Save Query…

设置搜索的区域

当前数据列表

其他数据列表

整个数据库

根据Form中填写的项目检索(结构为子结构检索,其他则要求完全相同)

取出当前搜索区域中的全部记录(打开数据库后做的第一件事)

自建查询语句

子结构检索(Sub-Structure Search)

要求和当前查询结构完全相同

察看上一次查询

保存当前查询

在图6.1例中,如果根据Form中填写的项目进行检索(“By Form”),则是目标记录的结

构包含2-Fluoro-pyridine片断,而且分子量不大于350;如果进行SSS检索,则只要目标记录

的结构包含2-Fluoro-pyridine片断;如果根据“Current Mol”查询,则目标结构必须是

2-Fluoro-pyridine而不能是其他的。

我们可以使用更加灵活和强大的自建查询语句方式进行检索。点击“Query Builder…”或

按下快捷键“Ctrl B”,弹出如下对话框:

12/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

在上图中,“Database fields”是待查询的数据项,“Operators”表示操作符,“Structure”式

输入的查询结构。在“Query string”一栏中即是它们组合成一个查询语句,其中,Root>Structure

和Root>*_Structure是Database fields,圆括号、and、sss、<= 都属于操作符(Operator),

“query”是当前查询结构,它既可以是你从“Query”窗口中输入的,也可以点击上图中的“Read

Structure”按钮,从外部调入查询结构(这个结构通常保存为.mol文件格式)。点击“OK”即

可得到结果。

S.7. 对象(Object)的管理

此处所说的对象(Object)包括如下内容:结构(Structure)、表列(List)、表单(Form)、

查询(Query)、排序指令(Sorting Instruction)和PL程序(PL Program)。在任何界面中,点

击菜单DatabaseObject Manager,弹出对话框(下图),在此处可以对各种对象进行管理,

比如改名、删除等。

13/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

每一项表示你已保存在库中的项目,其中一个List表示一个记录集,你可以把当前的全部

记录或一次查询结果保存为一个List,从而下次可直接打开而不必重新查询,或者和其他已有

的List进行集合运算,比如取交集、合并、排除相同项,等等,对提高工作效率非常有用。

S.8. 插件(Add-In)的使用和管理

点击菜单OptionsAdd-in Manager,可以看到ISIS/Base中已安装的插件。下面两个插件

需要单独安装(可在MDL公司网站下载或者已作为ISIS/Base软件的一个组件)。

➢ SAR TABLE:(Structure-Activity Relationship Table)构效关

系表,参见S.5节中的“导出到Excel表格文件”。

➢ AUTONOM:自动命名,目前版本是AutoNom2000,此版

本不能够命名一个环系统中的稠环上有螺环的结构,比如右

图的结构。

首先在数据库中定义一可变长文本(variable text)的数

据项,比如ChemName,然后进入“Forms”区,选择待命

名的Structure Box,点击菜单OptionsGenerate NameSet Structure Box,再添加

一个Box用以容纳ChemName,最后点击菜单OptionsGenerate NameSet

AutoNom Box for Registration,保存。向库中添加结构时,就会在这一栏中自动显示

出IUPAC命名。

S.9. ISIS/BASE附带工具软件的使用:

ConSystant:化学数据格式的转换工具

SMILESDF:SMILE文件中的字符个数不能超过32000个。

S.10. ISIS for Excel 2.0

14/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

S.10.1 简介

此软件独立于ISIS/Base发布(此软件不是ISIS/Base的组件,需要另外安装),作为Microsoft

Excel的模板工具,其功能非常强大,而使用则很方便,可以在Microsoft Excel界面中直接从

ISIS Database获取数据。它不同于前文所讲的“SAR Table”,其中的化学结构可以使用ISIS Draw

编辑,可输出到SD文件,亦可从SD文件输入,或者从ISIS/Draw输入,并提供了许多函数进

行计算,比如计算分子量、分子式、将结构转换成SMILES文本等。

软件安装前必须先安装好中文版或英文版Microsoft Excel 2000(当前版本不支持Excel2000

以后的版本,如Microsoft Excel 2002等),并具有管理员权限(使用时不需要)。装好后打开

Excel 2000,则可以看到菜单栏中出现了“ISIS”一项(在其他子菜单下亦有许多新的项目出现,

2.关闭整个程序

1.关闭当前文件

化学结构及其对应的模

板,不是从ISIS/Draw或

ChemDraw中粘贴进来

的OLE对象或图片

图10.1 ISIS for Excel 2000 主界面

如插入、格式),并在最左侧出现一个工具条,见下图中红色虚线框处:

使用特别提醒:

1.不管出于什么原因,Excel(以及微软其他的许多软件)是比较容易突然“崩溃”的(程

序突然失去响应或者突然消失),所以在使用Excel(以及其他较大型的软件如Word,OutLook,

PowerPoint等)时,切记时常的保存,不要寄希望于软件本身的“自动保存”,尤其是当文件中

包含较多的结构、图片时;在关闭文件或程序之前,切记先保存文件,不要寄希望于程序给你

保存文件的提示;首先关闭文件,再关闭整个程序(见图10.1中绿色框中的提示)。以上是对

你的劳动成果最安全的一种方式。

15/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

2.本软件中的“化学结构”都只能被本软件显示和处理,如果其他人没有安装,则不能

显示和处理,它不同于从ISIS/Draw或ChemDraw等软件中粘贴过来的结构(称为OLE方式)

或图片(见图10.1中蓝色框中的提示)。一个文件中如果有很多(比如几十、上百个甚至上千

个)这种粘贴来的结构(不论是OLE方式还是图片),则打开文件相对本软件要慢的多,而且

文件容易损坏。当然,安装了本软件的Excel打开时速度也会慢一些,但容纳几千或上万个结

构是没问题的(速度会更慢)。

3.Excel中的每个格子称为一个“cell”,每个“化学结构”都定位于每个cell中,不能直

接将cell中的结构Copy到其他应用程序中,必须编辑结构(见下一节S.10.2.1.),在ISIS/Draw

中Copy。这也是本软件的一个缺陷。但在Excel中同其他数据一样可以任意操作。

S.10.2 使用

本软件的使用都是在Excel界面中,因此使用时首先打开Excel或Excel文件。下文中的介

绍都是针对中文版Excel 2000,英文版的与之对应操作完全相同。

S.10.2.1. 功能项

在各个子菜单和工具条中有如下各项功能:

1)菜单编辑Edit Structure…:打开ISIS/Draw编辑已有化学结构,等同于在表格

中鼠标左键双击一个化学结构打开ISIS/Draw进行编辑;编辑后点击ISIS/Draw左上角的

按钮(Update and Return to Microsoft Excel)退回Excel。

2)菜单视图Molecular Values:察看和Copy结构的数据,如分子量、分子式、组

成、SMILES文本。

3)菜单插入Structure…:向一个cell中插入结构。在Excel中添加新的结构时必

须使用这一项。

4)菜单格式Structure…:调整结构显示的格式,比如调整大小、隐藏或去隐藏、

原子和键的显示方式(Properties)、将SMILES文本变成结构等。

5)菜单格式Mol Formula:将一个cell中的文本转变成分子式格式(字母大写,

数字为下标)。

6)菜单工具ISIS Preferences…:调整ISIS for Excel的选项。

7)菜单帮助ISIS for Microsoft Excel Help:帮助信息

8)菜单ISIS…:参见图10.2.

9)工具条:参见图10.2.。工具条集合了上述中常用的功能项,箭头表示与菜单ISIS

下项目的对应关系。

16/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

显示或隐藏

结构

放大或缩小

调整结构显示

的格式

察看结构的

数据

编辑

图10.2. 菜单ISIS子菜单和工具条

S.10.2.2. 从ISIS/Base数据库获取数据

1)直接从ISIS/Base获取数据

点击“Open Database” 选择要打开的ISIS/Base数据库(或者如果已经打开则点击

“Search”)(图10.2),(使用数据库根本的就是查询数据),弹出下面的查询对话框:

选择查询的范围(Search

Domain: Entire Database

or a List)

本次查询结果列表的名称

选择待查询数据域

是否要求排序

可以继续添加其他

查询标准(亦可点

击“Add”按钮)

鼠标双击或点击“Edit

Cell”按钮,编辑查询标

准(Search criteria)

图10.3 查询对话框

17/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

各项内容的说明见上图,使用方式参见S.6节。点击“Search”按钮后,会告诉你有

多少条记录被检索到,并弹出图10.4所示的对话框。

定义表格的格式,如数据

格式、每一列的名称等

要取出的数据列

名称

调整

顺序

图10.4 从库中提取检索到的数据

设置好以后,点击“确定”即可将数据从ISIS/Base中输到你的Excel表格里(图10.1),

第一行“Name,Structure,MW,CASRN”即是你在“Format Table”中定义的列名称(其

中“*_Structure”定义成“MW”,其他采用缺省的名称。

2)根据Excel表中的已有数据提取(查询)库中对应的其他数据

如果数据库还未打开,则打开数据库,但在出现图10.3的对话框时,点击“Cancel”

按钮。然后在Excel中选择要查询的数据列,点击“Retrieve Data” (),在图10.4中

的“Define Table”栏中,“Create Table from”自动选择“Column of Link Value”,并自动输

入你选择的行(row)的起止范围。如果你选择的数据列第一行已经包含了Field Name,

则起止行右边的下拉框(图10.4中红线框的部分)会自动定义为查询的数据域名,否则要

自己选定。这对批量检索非常有用。

S.10.2.3. 输入、输出SD文件

1)导入(Import):点击菜单ISISImportSDfile to Worksheet…,选择sdf文件,

则可将sdf中全部的数据导入Excel表中,其中的结构全部显示出来(图10.1)。

2)导出(Export):你可以选择输出整个表格中的全部数据,亦可只选择输出一部分。

如果选择导出的区域不连续,则应将中间的数据隐藏或删除,使选择区域连在一起。无论

18/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

哪一种,都必须在首行填写好数据域的名称(Field Name),对于化学结构必须是“Structure”。

如果希望将这个sdf文件导入到一个ISIS/Base库中,则两边的Field Name必须完全对应相

同(参见S.5. 从sdf导入ISIS/Base数据库一节)。

S.10.2.4. 函数使用

ISIS for Excel同时提供了一些宏命令可以用来做简单计算,比如计算分子量或分子式、

添加手性标志(Chiral)、把结构转成SMILES文本等。比如:

1)计算分子量,可以在相应的cell中直接输入“=ChemWeight(A2)”(不包括双引号),

其中“=”表示这是一个函数,()中的A2表示结构在第一列第2行,也可以从Excel的

输入栏旁点击“编辑公式”按钮,选择其他函数用户定义ChemWeight,然后“where”

指定好结构所在的cell(A2)。如果是计算一批结构,则将此公式粘贴到其他相应的cell

中即可(粘贴公式或鼠标十字线拖动)。

2)计算分子式,公式为“=ChemFormula(where,suppressZeroWeightAtoms)”,其中

suppressZeroWeightAtoms的值只能填TRUE或FALSE(或者是0和非0的数字),表示是

否要去除重量为0的原子(比如不能识别的元素符号)。其他同1)。

S.11. 其它化学软件

S.11.1 ChemOffice系列

此系列软件包括ChemDraw,Chem3D,ChemFinder,它们的使用可参考其帮助手册。另

外,如果我们已安装了ChemDraw Ultra 7.0,则它也在Microsoft Excel中安装了“ChemDraw for

Excel”,而且支持中英文版的Microsoft Excel 2002(Excel XP)。与ISIS for Excel类似,可以输

入或输出SD文件、调用ChemDraw添加、编辑结构,导入数据非常快(因为导入时不显示结

构),导入后只有在要求显示时才显示,但速度很慢。其功能更强的地方是提供的函数非常丰

富,除了分子量、分子式,还包括logP、Lipinski-Rule-5、氢键、可旋转键以及其他用于构效

关系研究的分子性质的计算。使用前,先在系统目录(比如C:WINNTSystem32)下察看是否

有版本较早的(~1.64M,Version < 7),如果有,则删除掉(总之,其版本号要与你

安装的ChemDraw一致)。然后打开Excel,菜单工具加载宏,选择“ChemDraw for Excel”,

“ChemSAR for Excel”等项,然后重启Excel即可。使用时,必须首先将当前的工作表

(Worksheet)转化为ChemDraw工作表(Convert/Update ChemDraw Worksheet),或者新建一

个ChemDraw工作表(New ChemDraw Worksheet)。其使用方法可自行了解。

S.11.2 化学计算和Modeling软件

➢ Microsoft Windows:DS modeling,Accord,DIVA,TSAR,CombiLibMaker

➢ SGI Workstation:Catalyst,Cerius 2,DiverseSolutions

其中CombiLibMaker和DIVA两

R1=H/CH3/OPh/…

个软件的操作过程是互逆的,前者是

将Scaffold和取代基组合成一系列的

R2=CF3/F/Cl/OH…

R3=CH3/OCH3/…

化合物,后者则是将一系列具有相同

Scaffold的化合物分割成各种取代基,

R1

比如右图中,红色部分为Scaffold,上

面有三个取代基,黑色箭头表示用

R2

N

N

R3

CombiLibMaker将Scaffold和R1、R2

O

以及R3组合成一系列的产物;蓝色箭

19/20

化学数据交流和化学软件使用 WuXi PharmaTech Co., Ltd

头表示用DIVA将这一些列化合物(它们都有共同的红色部分片断)拆解成R1、R2和R3三个

部分。在DIVA中输入SD文件,执行“Define R-Groups”,用鼠标圈定红色部分,即可得到

R1、R2和R3的列表,非常方便。

20/20


发布者:admin,转转请注明出处:http://www.yc00.com/news/1718786594a2752578.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信