用GEDmatch聚合你的DNA匹配
聚类是一种同时查看多个DNA匹配的方法,以确定你与它们之间的关系。GEDmatch有一个聚类工具,你可以用它来比较商业基因谱系检测公司的DNA试剂盒。
如何通过GEDmatch访问集群工具
在GEDmatch网站主页上,
登录访问Tier One Tools。
向下滚动到Tier 1 Tools。
选择选项“集群,单套件输入,基本版本!”
然后您将访问这个屏幕。
要使群集工具工作,您需要一个工具包号(来自GEDmatch上传)-您的,您的亲属,DNA匹配。
输入或复制并粘贴工具包号码到上面的表格。然后选择阈值,稍后我将讨论这个问题。
单击集群。
然后GEDmatch将收集所有数据以创建集群表。
根据阈值和匹配的数量,这可能需要几分钟的时间。坐好等着吧。
GEDmatch集群结果
一旦GEDmatch确定了所有内容的位置,它将显示一个类似于下面的表。
正如你在上图中看到的,GEDmatch将根据每个集群的平均共享厘米器官来安排你的DNA匹配。尽管这个过程可能需要3-5分钟,但当您看到套件来回移动时,可以看到这个图形。
根据您设置的阈值和匹配情况,这个表可能非常庞大。在视频中,我有500个匹配。在2021年的新更新中,我有167场比赛。
如果我从上面往下看,我将看到与我的DNA完全相同的名字。
每个DNA都匹配共享的厘摩根值在我设置的阈值之间匹配。此外,他们也会在这个阈值之间匹配其他人。这就是这些方框所表明的。
改变查看集群的方式
你可以用GEDmatch上的集群工具做的一件事是你可以改变它的显示方式。
如果我查看顶部的下拉菜单,您可以按名称、套件号、集群号或集群大小进行排列。
当我按集群大小排列集群时,所有数据都会根据最大的集群重新组织,然后依次排列。
你可以看到开始时这个巨大的星团。它们平均都有21厘米的器官。这将是一个非常遥远的关系,所有这些人与我。
如何用聚类图做遗传谱系
首先,我喜欢关注那些与我有最多相同DNA的集群。我用c来排列聚类光泽平均cM参照试剂盒.
然后我可以单击集群中的一个匹配项。GEDmatch将带我们进入一对一常染色体比较报名表。我们可以得到一对一的比较与集群中的任意一个匹配。
了解阈值
当我第一次创建GEDmatch集群图时,我使用了基本阈值,即15到50厘米organ。
我们可以改变这些数字。更改阈值可能会对集群图产生显著影响。它会影响到会的人数和集群的大小。
这一切都是因为你在观察这些人之间共享的厘米器官数量的不同范围。
假设我把阈值从15厘摩根降低到20厘摩根。我注意到,只要把阈值提高5厘米,匹配的数量就会减少,有时会减少近1/3。
这对那些家族中有很多内婚制的人来说很重要。通过将阈值的数量从15个改变到20个,你将排除许多可能比你想要查看的更遥远的人。
我们还可以改变上限。也许我们想把我们的表亲也包括进来。我们可以将阈值提高到100厘摩根。这样的改变不包括我的姑姑、叔叔、祖父母,但应该包括我的堂兄弟姐妹和第二堂兄弟姐妹。
灰色方块表示什么?
这种变化有一些有趣的事实。厘米器官的上限越高,我就能捕捉到越多的灰色方块。
这些灰色方块表示DNA匹配可能属于多个簇。
例如,一些匹配不仅属于橙色集群,也属于紫色集群。你的DNA越接近,你就会发现更多的簇重叠。所有这些都是由灰色方块表示的。
利用这些灰色方块作为线索,了解不同的星系团与你的关系。从本质上讲,你所做的就是根据其他人来对人进行分类。
无论您进行哪种类型的聚类,都将获得一些可能对您的系谱有帮助的信息。
↪️对DNA和家谱感到困惑?
拿起你的这个免费的DNA指南:
聚类和内婚制
聚类的一个真正棘手的问题是有内婚制的家庭。因为有如此多的共享DNA,您可能会以这个巨大的集群覆盖您的大部分页面而告终。
在这个视频中,我给你们展示了一个内婚制在聚类图上的例子。我还在下面附上了视频中集群的一张照片。我们可以看到这个橙色的集群中有450人。
从系谱学的角度来看,这只是太多的人试图在同一时间工作。从集群的角度来看,这个大型集群用处不大。
如果你的族谱中有内婚制,调整阈值,试着打破这样的集群。
还要注意,内婚制集群需要很长时间才能加载。视频中的图表花了大约7分钟,因为所有这些联系。
当我把最低阈值改为25厘摩根时,群集开始把这个巨大的群集分解成小的群集。虽然一旦我们降到足够低的地方,就会有一个非常大的集群,仍然是它的大多数。
更多使用GEDmatch的技巧
探索下面的博客文章,继续你的遗传家谱教育。