大家好,欢迎来到IT知识分享网。
统计数据是Perl最常用的功能。 今天我们通过一个简单的例子来看下如何统计数据。
题目:统计下列字符串中所有字母出现的次数
ATCCCGAAGGTAGATAACCGATTAGACG
分析:
我们需要统计每个字母出现的次数, 因此我们可以选用散列这个数据结构来进行数据的存储以及统计。
先定义数据和散列:
my $str = 'ATCCCGAAGGTAGATAACCGATTAGACG'; my %hash;
我们先把字符串根据单个字符拆分成字符数组:
my @strs = split '', $str;
split 是系统内置函数, 作用是将字符串根据给定的分隔符, 切分成数组。第一个参数是分隔符, 第二个参数是被分隔的字符串, 返回值是被切分出来的数组。
这里我们使用空分隔符, 也就是会将每个字符单独分割出来成为单独的元素。这样@strs数组中的每个元素, 都是单个的字符。
接下来, 我们遍历整个@strs数组, 统计每个字符
for my $char(@strs){ $hash{$char}++; }
++是自增运算符, 作用是+1, 也就是下面2个方式是等效的:
my $num = $num + 1; my $num++;
$hash{$char}++
这行代码中,其实我们将所有的统计逻辑都写在的里面
下面我们用更啰嗦的方式看下这行代码的具体内容:
if $hash{$char} { $hash{$char} = $hash{$char} + 1; }else{ $hash{$char} = 1; }
上面这几行代码和$hash{$char}++是等效的。
为什么我们可以不判断就直接自增呢?
我们具体根据if成立和不成立2种情况来看,
- 当if成立时, 也就是当前这个字符串作为key在我们的散列%hash中存在的, 那也就是说, 这个字符至少出现了一次。这个时候我们直接+1是没有问题的, 同时也将该字符这次出现统计了进去
- 当if不成立时, 也就是当前这个字符串作为key在我们的散列%hash中不存在, 那也就是说, 这个字符是第一次出现, 那我们应该给他赋值1(就像我们上面的else中的代码一样)。那为什么我们直接自增也可以呢?因为在Perl中, 当数据不存在(也就是undef)时, 在标量环境(记住, 一定是在标量环境下)下进行数字运算, 这个数据会被当作0来进行处理, 也就是说我们自增的时候相当于 0 + 1, 这样就等于直接赋值1了。
当我们遍历完整个数组时, 我们已经知道所有字符出现的次数了。下面我们将结果排序, 再打印出来:
for ( sort {$hash{$b} <=> $hash{$a} } keys %hash){ print "$_:$hash{$_}\n"; }
sort也是系统内置函数, 作用是用来排序, 花括号里面的内容为排序的规则(这边的意思是根据数字大小反向排序, 具体sort的用法以后详细说)。
这边我们使用sort将散列中的数据, 根据value的值, 从大到小排列以后, 再依次输出:
统计数据次数, 是Perl中使用散列数据唯一性这个特性比较常见, 也是比较高效的功能。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/123881.html