• 40004-91360
  • 智慧协同 未来病理
搜索
发新帖
查看: 8754|回复: 1

[学习交流] 【干货】大数据文本文件——编辑器的选择

[复制链接]

2

主题

10

帖子

144

积分

认证医师

Rank: 5Rank: 5

积分
144
发表于 2016-9-19 20:10:00 | 显示全部楼层 |阅读模式

登陆查看更多优秀资源帖,与同道便捷交流讨论

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
    对于大数据时代的生物科研工作者来说,无论是芯片还是高通量测序的数据处理,面临的核心问题都是对于文本的处理。无论是测序或者芯片,还是生物信息软件产生的大量数据,本质上都是文本,这也是近几年Perl语言在生物信息学领域被大量运用的原因。那么对于生物大数据,尤其是后期的数据分析及挖掘来说,文本的编辑工作也就贯穿于数据分析的每个阶段。
那么大家在日常数据处理工作中,是否也常遇到以下的这些问题:
1. 使用windows自带的notepad(记事本)及office三件套打开和编辑文本文件的效率十分慢(很多时候,一打开电脑就卡死了或者报错)
2. 如何去掉文本文件中的空白行
3. 如何对比两个文本文件的内容
4. 如何把一个排布混乱的数据整理成表格
5. 如何重一个数据表格中提取自己需要的内容
...............
是不是说着说着,发现往事历历在目,有种想要怒摔键盘的冲动。
冷静!!!古人有云:“工欲善其事,必先利其器。”
小编就依照经验给大家推荐三款简单易上手且功能强大的文本编辑利器:
Notepad++(中国,免费开源) , UltraEdit(美国,收费),
EditPlus(韩国,收费)
软件介绍
(1) Notepad++(这个是小编的最爱)
Notepad++是作为一款免费开源的文本编辑器,功能强大,UI界面友好,最重要的是自带中文,被很多编程及生信工作者所喜欢。除本身便利高效的编辑功能外,开源的Notepad++还可以通过安装一些扩充基本功能的外挂模组,来丰富自己的功能从而完成更多复杂的工作,例如文本内容的对比,筛选,插入等。
(2) EditPlus(小巧实用)
EditPlus是一款小巧但是功能强大的文本编辑器,可取代记事本的文字编辑器,拥有无限制的撤消与重做、英文拼字检查、自动换行、列数标记、搜寻取代、同时编辑多文件、全屏幕浏览功能。而它还有一个好用的功能,就是它有监视剪贴板的功能,同步于剪贴板可自动粘贴进 EditPlus 的窗口中省去粘贴的步骤,十分高效。
(3) UltraEdit(经典)
UltraEdit 是一套来自于美国的老牌文本编辑器,功能十分强大,可以编辑文本、十六进制、ASCII码,可同时编辑多个文件,而且即使开启很大的文件速度也不会慢(对电脑的配置有一定的而要求)。功能强大且全面,是使用比较广泛的文本编辑器。
软件测试

(1) 对于打开文本文件的大小方面:

不同的文本编辑器,在编辑文本文件时对于文件的大小是有限制的。我们通过这几款软件进行读取较大文本文件的测试,发现结果如下:

软件名称

读取文件大小

Notepad

1-100M

Notepad++

0-700M

UltraEdit

0-4G

EditPlus

0-500M

Window自带的Notepad在打开100M左右的文本文件时,小编的电脑就已经基本卡死;而Notepad++EditPlus的表现相差不多,虽然打开太大的文件时会报错但比Notepad要强大很多。在window的系统环境下,UltraEdit无疑是这方面的佼佼者,据官方的介绍对于编辑16G或者更大的文本文件,它也完全能够胜任(对与电脑配置有一定的要求),所以当您想要进行大文件的编写时UltraEdit无疑是您最佳的选择。

(2) 对于文件读取速度方面(这里测试的文本文件大小是为20M左右,如果文件较大,请直接使用UltraEdit进行编辑)

时间的宝贵不言而喻,对于平时进行生信工作,往往需要打开多个而且形式不同的文本文件的我们来说,文本编辑软件的读取速度就显得十分重要。我们对这三款软件的读取速度的进行了测试,结果如下:

EditPlus > Notepad++ > UltraEdit

在打开速度方面,UltraEdit本身因为集成了太多的功能所以在软件响应方面较慢。

(3) 对于文本文件的编辑功能方面:

文本编辑器最主要的功能还是进行文本的编辑工作,但是面对大数据文本文件word,execl等我们常用的工具软件在效率和功能方面已经无法满足我们的要求。我们对这三款软件在一些比较常用的文本编辑功能方面进行相测试,结果如下:

功能

Notepad++

UltraEdit

Editplus

文本对比

安装插件compare

可以直接使用

没有

检索、替换、插入及文本合并

可以

可以

可以

列模式

有(效果最佳)

对Linux下文件的正确换行

进行设置实现

进行设置实现

进行设置实现

去除文本的特定部分

可以

可以

可以

文本重排

可以

可以

可以

(4) 安装后软件的大小对比:

作为常用的文本编辑软件,它的软件大小通常也会成为人们是否选择安装它的一个考虑。

对此我们做了如下统计:

UltraEdit(146M)> Notepad++(6.82M)> EditPlus(5.12M)

总结:

根据上面对这三个文件编辑器软件的介绍,小编向大家推荐使用Notepad++主要的原因如下:1编辑和打开文本的速度;2编辑文本的功能;3,它是免费的软件(当然另外两个文本编辑器也是毫不逊色的);4软件大小,只有7M左右。

当然这里小编对于这三款文件编辑器的功能方面介绍还不是很完善,它们都是强大的软件,感兴趣的小伙伴可以收索相关资料进行学习。




本论坛为非盈利学术交流平台,资料均由网友上传,如涉及版权问题请及时联系管理员处理;所有讨论内容仅供公益交流,不代表本论坛立场。投诉邮箱:tougao@91360.com
回复

使用道具 举报

432

主题

3130

帖子

9610

积分

版主

Rank: 7Rank: 7Rank: 7

积分
9610

优秀版主

发表于 2017-5-18 10:12:38 来自手机 | 显示全部楼层
谢谢分享
本论坛为非盈利学术交流平台,资料均由网友上传,如涉及版权问题请及时联系管理员处理;所有讨论内容仅供公益交流,不代表本论坛立场。投诉邮箱:tougao@91360.com
回复 支持 反对

使用道具 举报

发新帖
使用 高级模式(可批量传图、插入视频等)
您需要登录后才可以回帖 登录 | 立即注册