第一幕
旁白:周启源的图像识别文字功能的软件,业已大功告成。在开源后的两天内,就有网友通过邮件找到了周启源。这份邮件用英文写的,为了方便阅读,这里将其翻译成中文。
场景:邮箱
网友:xx 你好,我是从 YouTube 上看到你的链接,觉得你的软件虽然好用,但有几个缺点:
1、在识别文字这一块,通过源代码,我发现你是调用 Tesseract 的 API 来实现的。也就是说,用户要想用你的软件,还需要先下载 Tesseract 软件,并下载相应的语言模型。这很麻烦,因为一般用户通常希望你,能够一站式地使用,当然,这是我的想法。
这里有一些解决办法,希望能够帮到你。Tesseract 是开源的,你未必要通过调用 API 的方式。你可以试着把 Tesseract 用 VS 编译,做成 dll,再直接通过 Python 来调用。这样,一方面可以压缩大小,提高速度;另一方面,用户亦不需要额外下载 Tesseract 软件。
2、在识别公式这一块,恕我直言(原文:my approgize if my suggestions offend you),效果并不好。通过源代码,我了解到你仍旧是通过 Tesseract 现实的。但这也是 Tesseract 的症结。本人亦尝试联系 Google ,并提出建议,无奈人微言轻。下面是本人的几点建议,希望能够帮助你完善你的软件。
(注:Tesseract 是 Google 的开源项目)
在识别公式这一块,我建议你可以使用 Mathpix Snip 的 API。它虽然收费,但其 API 是开放的。这个工具,可以很准确地将图片中的公式,转为 Latex 代码。这对你的软件,在公式识别这一块,无疑帮助是巨大的。
3、开源软件的推广,是很困难的。我意识到,类似的软件早已在手机市场遍上地开花。因此,我建议你,在你的软件上内置更多的功能,这有利于你的软件,在短时间内被人所知悉。
你真诚的(Sincerely)
友人(Your Friend)
旁白:周启源看到邮件后,感到异常欣慰,并接受了这位不知名的网友,弥足珍贵的意见。在回复了,一封表示真诚谢意的邮件之后,他再也没有收到网友的来信。因此,周启源到最后,还是没能搞清他的姓名。
落幕
第二幕
旁白:在周启源收到邮件后的几天,他按照网友的意见修改了软件。与此同时,在 NLP 中,他敏锐地发现,如果把关键句,比作浏览器中的重要网页,那么,不是可以用谷歌的网页排名算法,PageRank,来实现文本中,关键句的提取了吗?
为此,他再次不舍昼夜,终于在国庆黄金周内实现了。之后,他再次根据网友的建议,将关键句提取的功能,集成到软件中。他设想,以后阅读论文时,如果有这个软件,就可以通过直接复制、或者截图识别文字、之后,再提取关键句,不就可以快速阅读了吗?一想到这儿,尽管已经凌晨一点,他还是兴奋得手舞足蹈,并罕见地发了条朋友圈,介绍了这个天才的想法。
他的同班同学,邓揾文还在外地的酒店旅居。在养精蓄锐的夜晚,他打开微信,偶然间刷到了周启源的朋友圈。
场景:旅行蛙酒店,时间凌晨一点
邓揾文:“哼,这个屌丝,一发朋友圈,就是一堆看不懂的东西。”
女友(一旁看邓揾文的手机):“哦,是他啊!我知道他的,他开发的 Word 转手写体可帮了我不少的忙。我开的那家网店,就是用这个软件,给客户写感谢信的。这货太傻了,软件居然不收费,而且也不打广告,他拿什么赚钱?哼哼~”
邓揾文:“没文化,这叫开源。你先别吵,他好像又做了一个软件。”
女友:“我就是不明白这些人,为了关注数、粉丝量,把白白的赚钱机会,硬是....开源了出来。我用了他的软件,但才不给他点赞呢。要不然,别人也知道了这些软件,那岂不是烂大街了?好东西,就应该藏着掖着。”
邓揾文(盯着手机):“是啊,如果是段子、鬼畜、或者一些综艺新闻,我肯定会点赞、转发。这些东西,就是浪费人时间、精力用的。既然我看到了,浪费了我一份精神,那我肯定要推广一下,让更多的人都浪费一份精神,哈哈。”
女友(开灯):“我也一样。我点赞的,一般是一些浪费时间,精神的、或者是秀一秀生活,打击别人的东西。”
邓揾文:“真搞不懂这帮程序猿,情商真的低。呵呵,你看过哪个男的,把他女朋友也开源了。”
旁白:然而,邓揾文看过周启源的朋友圈,越发觉得这是个天才的想法。
邓揾文心想:反正现在软件刚发布,如果把它说是我的,应该没人会怀疑。对了,孙叔不是某互联网公司的老细吗,如果把软件卖给他,我不就大赚一笔了?凭我的三寸不烂之舌,肯定能瞒过去。到时候,钱拿到手了,版权问题,雨我无瓜,就让孙叔伤脑筋去吧。况且,周启源这个技术屌丝,别说懂不懂打官司了,恐怕被卖了都还不知道呢。哦,不好,这个赚钱的机会,不能让旁边的那个女人给看到了。不然钱岂不是要跟她分了?以后有钱了,一 jio 踢开她。
邓揾文(按捺住内心的狂喜):“这个屌丝,我还以为开发了新软件呢,原来又是一大堆看不懂的东西。算了,习惯了,早知道就不看他的朋友圈了。看完都想睡了。”
女友:“记住了哦,明天替我付淘宝的保证金哦~,我的店要上架新产品了。”
邓揾文:“所以你到底上什么产品?”
女友:“就是一些网上发现的教学视频啦,已经下载到网盘上了。我打算在淘宝上,一套卖五块钱。这些都很难找到,所以总有一些傻逼会来买的。”
“所以,记住了,以后看到类似的视频,一定不要点赞,否则我生意没法做了。”
(关灯,两人下)
落幕
第三幕
旁白:距离周启源写完书,交给编辑,并填完 xx 出版社的选题单,已经有一个星期了。虽然这阵子忙于搞研究、做开发,但还是将编辑陈鱼洛的微信置了顶,开了强提示。
场景:微信聊天(陈鱼洛&周启源)
陈鱼洛:“你的简历被出版社打回来了”
“1、年龄太小,出版社觉得不靠谱,所以不愿意出书”
“2、资历不够,只是大学生,没有项目经验”
“3、开源项目,出版社有不相信的倾向”
“看怎么充实简历,让出版社觉得很牛,或者找一个牛人挂第一作者”
周启源心想:找牛人挂靠?恐怕牛人之所以牛,就是这么来的。但为了开源,为了我的书,能够对国家的机器学习事业,有一点绵薄的贡献,一点名又算什么呢?当年的特斯拉前辈,都能撕掉自己的版权,毅然推广交流电,我又何尝不可?哎!
周启源:“出版社也是有道理的,毕竟这些,硬条件,我都没具备”
陈鱼洛:“是的,简历你看怎么补充一下。虚拟一下,让简历看起来很牛”
周启源:“emmmm,我觉得不太好[困惑],有其他办法吗?”
陈鱼洛:“那就找一个比较牛的作者当第一作者”
周启源:“挂靠也行啊,只不过我身边没有合适的人”
陈鱼洛:“我这边帮你问问,如果你同意的话”
周启源:“好,真是太谢谢你了,我本人是同意的”
陈鱼洛:“不客气,我问问”
旁白:关了微信,周启源有种丢了魂的感觉。
周启源心想:为什么,我能说动自己,接受挂靠这一现实,但就是感觉不舒服呢?对呀,如果能够让自己的精髓、知识,传递给全国的人、甚至全世界的人,第一作者是谁,真的很重要吗?可是,为什么,我就是感到很不爽呢?
嗯,书的封面会写上“周启源”这个第二作者吗?应该会吧。如果是这样,我就心满意足了。可是,为什么我就是不能洒脱一回呢?我究竟在担心什么呢?担心封面上没有我的大名,担心没人给我挂靠,担心我的书,就因为一些奇怪的理由,而不能出版?
换个角度想,有人当第一作者,如果书出错了,不就没有我的责任吗?这也是个好处哦。
可是,项目经验不够?为什么?自己所做的项目,无论是开创计算机视觉的“文本流”,还是手下的几个开源软件,还是自己参加的比赛,抑或是博客,都是自己项目的证明啊?
难道,一个开源的人,就应该推销自己吗?每当我拿了奖,或是开源,都会提醒自己,不要致力井底之蛙的斗争。我只是想,像特斯拉、邓稼先、袁隆平一样,靠着自己的成果,在历史上留下痕迹。而不是像爱迪生、洛必达一样,靠着推销、别人的成果、以及一点努力,就扬名天下。我讨厌范仲淹,他是为国为民,但为什么还要把“先天下之忧而忧”挂在嘴上?我更喜欢司马迁、李贽,把自己的作品藏诸名山,让后人去“挖掘”他们的功绩。
我鄙视那些虚无的,所谓的虚名、所谓的财富,但我在名利面前,却又如此痛苦。我因自己的作品开源而感到欣慰,但却始终无法对数理大赛的俩队友释怀。我一方面努力打破樊笼,构造一个开源的、不求名利的世界。但另一方面,我何尝不是把自己,困在另一个,追名逐利的樊笼之中?
人,真的能够为了自己的理想、喜好,不求回报地付出一切吗?九泉之下,那些为了祖国的未来的,杰出潇洒、不怕牺牲、无私奉献的仁人志士们,他们是否也曾想过这个问题?
落幕