独家访谈 | 虚拟细胞挑战赛困境何在

**Author:** BioTender观测日志

本期邀请到了来自Mila的yuanxinyu师姐来分享一下她对虚拟细胞挑战赛的经历与认识

--- Transcript --- Hello 大家好我是Max 本期节目我们邀请到了来自米娜的原星域世界来分享一下她对于虚拟细胞挑战赛的经历与认识对我觉得他们的那个尝试是一个很好的尝试吧因为总得有人往前花一些钱然后走一些路然后去探路嘛我觉得但他们比如说他们中间 11月吧他们的指标有问题就他们指标的实现其实有问题然后被很多而且包括他们去评测的这个方式也有问题就讲得具体一点就其实这个也很简单就讲这些大概就是说你的你在做evaluation的时候你这个出销跟你的这个预测的这个销你需要把这两个举证拿去做对比买凡去计算一些metrics 然后这单个比如说你的出销你们有两类一类是control销一类是perturbs销那他们的evaluation pipeline 就是没有对你提交的这两个举证有一些细致的限制这就导致了很多人他们发现你可以通过一些就是一些操作就是比如你把比如说你把那个一些销的那个数值保证保持为整数就是那个很大的一个整数然后你把另外一些数值保持比如log完了之后的一个数然后反那样去交这是其中一个例子然后他们他们就是那讨论挺机械还有一些其他的就是这种去hack的这种技术有这种技术挺多的然后导致当时很多提交 performance 大家其实觉得都很不靠谱然后他们那个evaluation pipeline 应该也是一开始他们一直不respond 然后直到快快结束的时候可能过了大概先四个周三个周百他们可能才respond的一个他们都现在这个evaluation没问题然后然后就要这样这样结束然后大家都很无语吧我觉得了然后为啥我要我觉得我浪费的时间是因为他们的那个data 我觉得他们用的那个data 有点太difficult了就是或者怎么说呢就他们他们用的是一个 genetic perturbation data 我觉得大概就不到不到一个million的总量吧然后是 pervation数量特别多大概是几千还是几万反正反正就说你在同一个pervation上你的有效的样本量大概只有几百这个东西非常难学然后我们当时就是用一些可能翻悉一点的model 就是比如像difusion这种就是我们这个模型去试了一下然后发现他那个样本量不够然后我们其实就学不好然后我们后面就就let go了但后来就是看那个结果出来之后发现可能还是一些就是更正统的偏生性的方法会更管用一些然后也没办法说完那确实人家生性研究的比较深入不是我们这种搞AI的就是跳进去能做的对就是如果不是功力的去说这个事的话其实谁也不知道你这个所谓的 pervation到底应该怎么样做更好但是如果说就只举现在其中的一点点match上然后不去把这个benchmarking给扩大甚至我觉得他们现在这些已有的这12个match 其实都是不够的就如果不把这个benchmark做强的话其实很难吸引到其他领域比如像做mash learning的人去这个领域去做一些technical上的一些尝试比如之前protein为啥能发展那么快一方面肯定是因为molecule和graph 之前已经火了然后后面做molecule那些人没东西做了做protein 这是一波人但还有一个比较重要的原因是就是protein的benchmark做得很solid 就是你你那个structure该啥样你做应该啥样然后你保证这个东西 unseen 那它这个structure就是unseen 那你这个东西是有保证的那我是learning的人一看你这个东西你evaluation确定了那我进来我就只需要刷个方法那这东西我假都能跳进来水一水对吧但如果如果需要这一块benchmark没有搞定的话其实我感觉很难吸引到除了生性之外的人包括像像我们这种就做交叉的嘛就除了我们这种就很难有人进来做