python数字转字符串固定位数_python-将String转换为64位整数映射字符以自定…「建议收藏」

python数字转字符串固定位数_python-将String转换为64位整数映射字符以自定…「建议收藏」您将4个不同“数字”的字符串解释为数字,因此以4为基数.如果您有一串实际数字,范围为0-3,则可以让int()真正快速地生成一个整数.defseq_to_int(seq,_m=str.maketrans(‘ACGT’,’0123′)):returnint(seq.translate(_m),4)上面的函数使用str.translate()用匹配的数字替换4个字符中的每个字符(我使用静态s…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

您将4个不同“数字”的字符串解释为数字,因此以4为基数.如果您有一串实际数字,范围为0-3,则可以让int()真正快速地生成一个整数.

def seq_to_int(seq, _m=str.maketrans(‘ACGT’, ‘0123’)):

return int(seq.translate(_m), 4)

上面的函数使用str.translate()用匹配的数字替换4个字符中的每个字符(我使用静态str.maketrans() function创建转换表).然后将所得的数字字符串解释为以4为底的整数.

请注意,这将生成一个整数对象,而不是零和一个字符的二进制字符串:

>>> seq_to_int(‘TGTGAGAAGCACCATAAAAGGCGTTGTG’)

67026852874722286

>>> format(seq_to_int(‘TGTGAGAAGCACCATAAAAGGCGTTGTG’), ‘016x’)

’00ee20914c029bee’

>>> format(seq_to_int(‘TGTGAGAAGCACCATAAAAGGCGTTGTG’), ‘064b’)

‘0000000011101110001000001001000101001100000000101001101111101110’

这里不需要填充;只要您的输入序列为32个字母或更少,则结果整数将适合无符号8字节整数表示形式.在上面的输出示例中,我使用format()字符串分别将该整数值格式化为十六进制和二进制字符串,然后将这些表示形式零填充到64位数字的正确位数.

为了衡量这是否更快,让我们随机抽取一百万个测试字符串(每个字符串长28个字符):

>>> from random import choice

>>> testvalues = [”.join([choice(‘ATCG’) for _ in range(28)]) for _ in range(10 ** 6)]

在使用2.9 GHz Intel Core i7的Macbook Pro和Python 3.6.5上,上述功能可以在3/4秒内产生100万次转换:

>>> from timeit import timeit

>>> timeit(‘seq_to_int(next(tviter))’, ‘from __main__ import testvalues, seq_to_int; tviter=iter(testvalues)’)

0.7316284350017668

因此,每个通话为0.73微秒.

(以前,我提倡使用预计算版本,但经过试验,我采用了以4为底的想法).

要将其与到目前为止发布的其他方法进行比较,还需要调整一些方法以产生整数,并将其包装到函数中:

def seq_to_int_alexhall_a(seq, mapping={‘A’: b’00’, ‘C’: b’01’, ‘G’: b’10’, ‘T’: b’11’}):

return int(b”.join(map(mapping.__getitem__, seq)), 2)

def seq_to_int_alexhall_b(seq, mapping={‘A’: b’00’, ‘C’: b’01’, ‘G’: b’10’, ‘T’: b’11’}):

return int(b”.join([mapping[c] for c in seq]), 2)

def seq_to_int_jonathan_may(seq, mapping={‘A’: 0b00, ‘C’: 0b01, ‘G’: 0b10, ‘T’: 0b11}):

result = 0

for char in seq:

result = result << 2

result = result | mapping[char]

return result

然后我们可以比较这些:

>>> testfunctions = {

… ‘Alex Hall (A)’: seq_to_int_alexhall_a,

… ‘Alex Hall (B)’: seq_to_int_alexhall_b,

… ‘Jonathan May’: seq_to_int_jonathan_may,

… # base_decode as defined in https://stackoverflow.com/a/50239330

… ‘martineau’: base_decode,

… ‘Martijn Pieters’: seq_to_int,

… }

>>> setup = “””\n… from __main__ import testvalues, {} as testfunction

… tviter = iter(testvalues)

… “””

>>> for name, f in testfunctions.items():

… res = timeit(‘testfunction(next(tviter))’, setup.format(f.__name__))

… print(f'{name:>15}: {res:8.5f}’)

Alex Hall (A): 2.17879

Alex Hall (B): 2.40771

Jonathan May: 3.30303

martineau: 16.60615

Martijn Pieters: 0.73452

我提出的以4为基的方法很容易赢得这一比较.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/189555.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • scp和rsync命令[通俗易懂]

    scp和rsync命令[通俗易懂]SCP命令(1)scp定义scp可以实现服务器与服务器之间的数据拷贝。(fromserver1toserver2)(2)基本语法scp-r$pdir/$fname$user@$host:$pdir/$fname命令递归要拷贝的文件路径/名称目的地用户@主机:目的地路径/名称(3)基本示例scp-rjdk1.8.0_291/root@hadoop103:opt/modulescp-rroot@hadoop102:/opt/module/*root@h

    2022年8月30日
    4
  • 发送邮箱和短信_139邮箱发短信收费吗

    发送邮箱和短信_139邮箱发短信收费吗发送邮箱和短信一、邮箱:(这里用QQ邮箱eg)步骤1、设置QQ邮箱开启并获得(秘钥)ptrylchonikrbcXX(不是真的)步骤2、导入依赖(未用SpringBoot框架)<!–邮件发送–> <dependency> <groupId>javax.mail</groupId> <artifactId>mail</artifactId> <version>1.4.7</

    2022年10月9日
    1
  • 图片介质受写入保护_写入保护

    图片介质受写入保护_写入保护最近使用U盘,突然不能正常使用了,在U盘内新建文件夹,提示“介质受写入保护”无法创建文件,赶紧网上查找解决办法。查找的结果比解释比较全面的就是:方法一:格式化我的电脑(右击)-管理-磁盘管理-选中U盘右键删除后格式化(网上的方法,这招肯定能用,但是适用于没有重要数据的前提下,格式化后之前的数据会全部丢失)方法二:修改注册表1、打开注册表win+R(即开始-运行)键入regedit.exe2、进入如…

    2025年7月16日
    5
  • 连不上docker mysql_docker跨主机通信

    连不上docker mysql_docker跨主机通信宿主机连接docker中的mysqldokcer安装mysqldockerrun\–namemysql\-v$PWD/mysql:/var/lib/mysql\-p3306:3306\-eMYSQL_ROOT_PASSWORD=123456\-dmysql:5.7宿主机连接docker中的mysql错误的连接方式$mysql-uroot-pEnterpasswor…

    2022年8月21日
    6
  • lucene分词器中的Analyzer,TokenStream, Tokenizer, TokenFilter

    lucene分词器中的Analyzer,TokenStream, Tokenizer, TokenFilterTokenStream:分词器做好处理之后得到的一个流。这个流中存储了分词的各种信息,可以通过TokenStream有效的获取到分词单元。以下是把文件流转换成分词流(TokenStream)的过程首先,通过Tokenizer来进行分词,不同分词器有着不同的Tokenzier,Tokenzier分完词后,通过TokenFilter对已经分好词的数据进行过滤,比如停止词。过滤完之后,把所有的数据组合成一个TokenStream;

    2022年7月22日
    10
  • JS中innerHTML、outerHTML、innerText、outerText的用法与区别

    JS中innerHTML、outerHTML、innerText、outerText的用法与区别1、功能说明:innerHTML设置或获取位于对象起始和结束标签内的HTMLinnerText设置或获取位于对象起始和结束标签内的文本outerHTML设置或获取对象及其内容的HTML形式outerText设置(包括标签)或获取(不包括标签)对象的文本2、示例页面有如下代码:span1span2varinnerHTML=document.getElemen

    2022年6月16日
    30

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号