查看原文
其他

bioSyntax:针对生物数据的语法高亮

Y叔 biobabble 2020-02-05


对于生信狗,天天黑白命令行,实验室的同事,经常对着我的Emacs说,这么小的字体你看得清吗?我只能无奈地回答,因为我要一个屏幕显示一整个函数。我自己平时写代码也很注意这一点,函数尽量小,太长就要考虑切分成几个函数,我说自己是脑容量不够,写不了长函数。我希望如果有人看我代码,他/她可以看得舒服点,虽然写的不见得好,但起码一个函数,你一个屏幕是装得下的。岁月留给我们的,是越来越厚的镜片!然而最近有一款神器,让我们在命令行里,可以高亮显示生物学常见的数据格式,包括SAM, VCF, GTF, PDB和FASTA。这款神器叫bioSyntax (http://bioSyntax.org) ,看着舒服多了,而且逼格十足,如果大家序列比对看多了,其实都会依赖于看颜色,黑白字体情况下,你很难去区分ATCG,即使有明显的pattern,你也很难看出来。



bioSyntax: Syntax Highlighting For Computational Biology
doi: https://doi.org/10.1101/235820
https://www.biorxiv.org/content/early/2017/12/20/235820

就在四个月前,这一工具在biorxiv上发表了preprint版本的文章,大家有兴趣可以上去看一下。



上面这张是文章里的图,上面是没有使用biosyntax的版本,下面是使用了biosyntax的版本。它还支持常用的文本编译器的语法高亮,比如vim, gedit, sublime等。



至于安装,官网(http://bioSyntax.org)上有详细的手动安装文档,也有安装脚本,让小白一键安装,当然这个脚本还没有很完善,我安装的时候,就发现有问题,并且给他们提交了一个补丁(https://github.com/bioSyntax/bioSyntax/pull/3)修复了,目前高亮不支持Mac版本的zsh,作者还在完善中,所以还可以再等等,等完善了再来使用。


上面这段是4个月前写的,当时预印本文章刚出来,我当时试用并发现了问题,于是提交了个补丁,他们很快就merge。今天突然收到说要在文章中致谢我。几个月过去了,现在应该比较稳健了,大家赶紧去试试吧。


神器系列

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存