代码拉取完成,页面将自动刷新
同步操作将从 Vincent.Gao/甲基化生信分析pipeline 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
# -*- coding:utf-8 -*-
import sys
import re
import shelve
in_file = sys.argv[1]
out_file = sys.argv[2]
with open(in_file) as f,open(out_file,"w") as w: # 从refseq文件中提取位点信息,找出gene长度最长的信息,保存为按chr顺序存储的字典
dicc = {}
for i in f:
chr_pos = i.split("\t")[2]
length = len(range(int(i.split("\t")[4]),int(i.split("\t")[5])))
gene = i.split("\t")[12]
if chr_pos not in dicc.keys():
dicc[chr_pos] = {}
else:
if gene not in dicc[chr_pos].keys():
dicc[chr_pos][gene] = range(int(i.split("\t")[4]),int(i.split("\t")[5]))
else:
if len(dicc[chr_pos][gene]) < length:
dicc[chr_pos][gene] = range(int(i.split("\t")[4]),int(i.split("\t")[5]))
else:
pass
with shelve.open('ucsc') as db:
db['ucsc'] = dicc
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。