[题型设计]字符串相似度匹配

发表于 2019-06-15 更新于 2024-03-06 分类于技术文章阅读次数：本文字数： 497 阅读时长 ≈ 1 分钟

近段时间接触了基因比对算法, 业界最常使用的是BWA算法, 我现在还不了解具体如何实现的, 这里只是准备把算法用计算机的语言描述一下.

请听题:

假设有一长字符串, 有以下特征:

另外有一短字符串, 短字符串有如下特性:

此外, 还有一点:

短字符串比较多, 可能长字符串同一个位置会有段短字符串匹配, 也可能没一个匹配到的
短序列的起始和结束位置是不固定,
目前的高级的测序仪器, 平均所有短序列的覆盖深度为50X, 即总共的字符为30亿*50, 如果短字符长度为100的话, 就有30亿*50/100 = 15亿条.

问题: