脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - perl - perl 读取所需文件的路径,然后打开相应的文件

perl 读取所需文件的路径,然后打开相应的文件

2020-06-14 10:24perl教程网 perl

perl,读取所需文件的路径,然后打开相应的文件,并对文件中的DNA序列进行计数,substr函数对长字符串的片段化处理功能

以下是DNA序列,存储在window下F:\perl\data.txt里面:

复制代码 代码如下:

AAAAAAAAAAAAAAGGGGGGGTTTTCCCCCCCC 
CCCCCGTCGTAGTAAAGTATGCAGTAGCVG 
CCCCCCCCCCGGGGGGGGAAAAAAAAAAAAAAATTTTTTAT 
AAACG 

 

下面是程序:

复制代码 代码如下:


#下面的程序是用来计算一段DNA序列中ATGC的数量的

 

#首先定义四种碱基的数量为0
$count_A=0;
$count_T=0;
$count_C=0;
$count_G=0;
#首先要先把序列进行合并成一行

#先确定所要处理的文件的路径及文件名(在windows系统下面要按照这样的例子写
#f:\\perl\\data.txt
print "please input the Path just like this f:\\\\perl\\\\data.txt\n";
chomp($dna_filename=<STDIN>);
#打开文件
open(DNAFILENAME,$dna_filename)||die("can not open the file!");
#将文件赋予一个数组
@DNA=<DNAFILENAME>;

#以下两步要把所有的行合并成一行,然后去掉所有的空白符
$DNA=join('',@DNA);
$DNA=~s/\s//g;

#将DNA分解成,然后赋值到数组
@DNA=split('',$DNA);

#然后依次读取数组的元素,并对四种碱基的数量进行统计
foreach $base(@DNA)
{
 if ($base eq 'A')
 {
  $count_A=$count_A+1;
 }
 elsif ($base eq 'T')
 {
  $count_T=$count_T+1;
 }
 elsif ($base eq 'C')
 {
  $count_C=$count_C+1;
 }
 elsif ($base eq 'G')
 {
  $count_G=$count_G+1;
 }
 else
 {
  print "error\n"
 }
}
#输出最后的结果
print "A=$count_A\n";
print "T=$count_T\n";
print "C=$count_C\n";
print "G=$count_G\n";


下面是运行的结果:

复制代码 代码如下:


F:\>perl\a.pl
please input the Path just like this f:\\perl\\data.txt
f:\\perl\\data.txt
error
A=40
T=17
C=27
G=24

 

F:\>


大家可能观察到有一个error的出现,这是为什么呢?

 

大家仔细看一看最上面的原始 DNA序列,用特殊颜色标记的,可以看到有一个V,所以会输出错误。

这里把DNA序列经过整合成一行,然后去除所有的空白字符以后,又把$DNA通过split函数变成了数组,然后进行统计,那有没有更好的办法呢?

其实perl里有一个函数,substr。

我们先来看一看这个函数的用法,substr是针对一个大字符串的操作符(The substr function works with only a part of a larger string )言外之意就是对一个很长的字符串,进行片段化处理,取其中的一部分。我们这里用到的就是这个特性。

$little_string =substr($large_string,$start_position,$length)

$小片段=substr($大片段,$你要截取的小片段的起始位置,$你要截取的长度)

我们这里为了统计DNA中各种碱基的数量,所以要处理的字符串是一个碱基,所以我们要把$length设置为1。这样才能够满足我们的需求。

下面我们把修改过的代码写下:

复制代码 代码如下:


#下面的程序是用来计算一段DNA序列中ATGC的数量的

 

#首先定义四种碱基的数量为0
$count_A=0;
$count_T=0;
$count_C=0;
$count_G=0;
#首先要先把序列进行合并成一行

#先确定所要处理的文件的路径及文件名(在windows系统下面要按照这样的例子写
#f:\\perl\\data.txt
print "please input the Path just like this f:\\\\perl\\\\data.txt\n";
chomp($dna_filename=<STDIN>);
#打开文件
open(DNAFILENAME,$dna_filename)||die("can not open the file!");
#将文件赋予一个数组
@DNA=<DNAFILENAME>;

#以下两步要把所有的行合并成一行,然后去掉所有的空白符
$DNA=join('',@DNA);
$DNA=~s/\s//g;


#然后依次读取字符串的元素,并对四种碱基的数量进行统计
for ($position=0;$position<length $DNA;++$position)
{
 $base=substr($DNA,$position,1);
 if ($base eq 'A')
 {
  $count_A=$count_A+1;
 }
 elsif ($base eq 'T')
 {
  $count_T=$count_T+1;
 }
 elsif ($base eq 'C')
 {
  $count_C=$count_C+1;
 }
 elsif ($base eq 'G')
 {
  $count_G=$count_G+1;
 }
 else
 {
  print "error\n"
 }
}
#输出最后的结果
print "A=$count_A\n";
print "T=$count_T\n";
print "C=$count_C\n";
print "G=$count_G\n";

 

得到的结果如下:

复制代码 代码如下:


F:\>perl\a.pl
please input the Path just like this f:\\perl\\data.txt
f:\\perl\\data.txt
error
A=40
T=17
C=27
G=24

 

F:\>

 

延伸 · 阅读

精彩推荐
  • perlperl use vars pragma使用技巧

    perl use vars pragma使用技巧

    perl 中的vars是perl中的一个pragma(预编译指示符),专门用来预定义全局变量,这些预定义后的全局变量在qw()列表中,在整个引用perl文件中皆可使用,即便使...

    perl教程网6812020-06-16
  • perlPerl使用nginx FastCGI环境做WEB开发实例

    Perl使用nginx FastCGI环境做WEB开发实例

    这篇文章主要介绍了Perl使用nginx FastCGI环境做WEB开发实例,实现了路由系统和模板系统,需要的朋友可以参考下...

    Perl教程网2412020-06-18
  • perlPerl List::Util模块使用实例

    Perl List::Util模块使用实例

    这篇文章主要介绍了Perl List::Util模块使用实例,本文给出扫描符合条件的某个列表并取出第一个符合条件的、求1到1000之间的和 、求一组数字的最大值与最小...

    脚本之家4712020-06-22
  • perlPerl的经典用法分享

    Perl的经典用法分享

    Perl的经典用法分享,学习perl的朋友可以参考下 ...

    脚本之家6562020-06-06
  • perlperl命令行参数内建数组@ARGV浅析

    perl命令行参数内建数组@ARGV浅析

    这篇文章主要介绍了perl命令行参数内建数组@ARGV浅析,本文重点在于讲解@ARGV的用法,并通过实例来说明,需要的朋友可以参考下 ...

    perl教程网6162020-06-18
  • perlperl pop push shift unshift实例介绍

    perl pop push shift unshift实例介绍

    perl的pop跟push操作数组的最右边,shift跟unshift操作数组的最左边 ...

    脚本之家4612020-06-10
  • perlperl常见问题集合之二

    perl常见问题集合之二

    哪些平台上有 Perl?要到哪里去找? Perl的标准发行版(由 perl 发展小组负责维护)仅以原始码形式发行。您可在 http: //www.perl.com/CPAN/src/latest.tar.gz处取得。这个档...

    脚本之家2102020-05-29
  • perlPerl从文件中读取字符串的两种实现方法

    Perl从文件中读取字符串的两种实现方法

    有时候我们需要从文件中读取字符串,这里简单介绍下, 需要的朋友可以参考下 ...

    脚本之家6252020-06-08