首页 > 都市小说> 穿越:2014 > 第351章 高阶博弈话语权之争

第351章 高阶博弈话语权之争

2023-08-01 作者: 猪熊
  第351章 高阶博弈话语权之争

  理解了算法能换钱。

  其实也就不难理解数据为什么能换钱。

  毕竟数据是很多机器学习算法构建的基石。

  机器学习算法的出现往往要依赖于有标注的数据。

  而且在相当长的一段时期内机器学习算法不仅是依赖于有标注的数据。

  而且是依赖于大量有标注的数据。

  标注数据量较小的情况下,很多时候是不足以训练一个性能优异的机器学习算法的。

  从这个角度出发,就不难理解数据为什么可以换钱。

  很多时候甚至可以完全可以把数据理解为是一种隐性的知识。

  而数据标注的过程实际上就是将散漫自有的离散数据结构化、标签化的过程。

  在算法和数据之外,所谓的狭义知识是什么呢?

  狭义知识一般指通过规则或词典等形式由人工定义的显性知识。

  狭义知识主要包括三种:

  ——即语言知识、常识知识和世界知识。

  其中,语言知识是指对语言的词法、句法或语义进行的定义或描述。

  其主要特色是定义了同义词集合。每个同义词集合由具有相同意义的词组成。

  常识知识是指人们基于共同经验而获得的基本知识。

  世界知识包括实体、实体属性、实体之间的关系等。

  或许有人不理解?
  为什么这类知识能换钱呢?
  这些东西不都是显而易见吗?

  这些知识虽然本质上依旧是人们所能理解的显性知识。

  但对人们来说显而易见的显性知识。

  不等于对机器同样是显而易见的。

  对于这类知识往往要通过规则化或者是词典化的处理以便于这些知识能够通过简单的处理成让机器理解。

  这些很容易被机器所理解的知识叫狭义知识,也被称为专家知识。

  尽管现在主要训练模型已经是谋求算法甚至是数据本身了。

  但狭义知识是相当有市场的。

  反正从此前和伊芙·卡莉的交流来看。

  都2014了,硅谷现在开发点什么机器学习仍旧是要动不动跟哈佛、牛津之类高校合作。

  这些人之所以仰仗哈佛、牛津除了是指望这些高校进行下数据标注之外。

  主要应该就是指望着这些高校在狭义知识方面的加持了。

  这些人这么做也容易理解。

  毕竟最早涉及到自然语言处理方面的模型数据的时候人们是用狭义知识进行训练的,而不是依靠数据和算法。

  甚至林灰印象中,即便是前世,在互联网迅速崛起之前,人们唯一训练自然语言处理方面模型只能是用狭义知识。

  而林灰手中就拥有相当多的狭义知识,且水平什么的应该比现在西方世界所用的不知道高多少。

  从硅谷为了获取狭义知识每年砸几千万美元的架势来看。

  林灰手中的一些狭义知识如果能够拿来变现的话要比利用标注数据变现还方便。

  但这仅仅是理论上容易变现。

  林灰没有绝对的话语权以及随之而来的权威性。

  林灰怎么去向潜在的受众去说其所拥有的狭义知识资料要比现在硅谷所用的普遍材料更高明呢?

  其实潜在的买家林灰倒是清楚的很。

  要知道就算是在往后几年对大量的狭义知识感兴趣并且又不差钱的买家其实也不是特别多。

  林灰估计这个时空下可能对大规模狭义知识库感兴趣的买家无外乎是Microsoft、Google之类的超级巨头。

  不过纵然是知道这些潜在买家,林灰也不可能去主动找对方啊。

  那样的话岂不是成为了兜售么?
  而兜售等于直接丧失了主动性。

  毕竟按照买家的思维逻辑是:
  兜售等同于卖家对产品不自信。   
  亦即商品缺乏权威。

  对于有的商品缺乏权威等同于直接给判了死刑。

  买家凭什么要为缺乏权威性的内容买单呢?
  或许这只是林灰的臆测,但林灰觉得这种事情是大概率事件。

  没权威性,纵然是更高水平的东西。

  想拿来换钱也是很蓝的啦。

  而拥有了绝对的权威性,事情则不一样了。

  很多时候就成了卖家市场。

  买家上门求着那种。

  就像伊芙·卡莉描述下的自然语言处理方面的算法团队兴衰轮转不断。

  但哈佛、牛津之类的高校却始终不用担心没有算法团队去同他们进行合作。

  毕竟某种程度上这些顶级高校在狭义知识尤其是在部分NLP开发离不开的语言知识上几乎就等同于权威。

  这种情况下别说这些高校不用担心吃饭的问题。

  甚至是很多算法团队也得看人家脸色。

  拥有权威性。

  实际上在狭义知识机器化水平方面没那么高的水平也很容易吸金。

  甚至是不需要这些高校亲自去产出知识。

  很多时候第三世界国家生产出衬衫、裤子等等服装,而发达国家直接拿去贴个商标。

  这一过程发达国家几乎做的是最少的,但却轻松攫取最大头的利润。

  偏偏贴标这事不只是存在在服装领域。

  在机器学习方面,很多时候拥有强大权威性的团队一样可以直接对“通行知识”进行“贴标”。

  对,没错,知识贴标。

  这才是真正意义上的躺着赚钱。

  而且是躺在大气层那种。

  很美好,不过很遥远。

  不过林灰也不必要太灰心。

  因为涉及到话语权的追求,林灰并不孤单。

  和林灰同行并不是某人。

  而是一个五千年悠久历史的东方古国。

  林灰相信通过不断的求索会一天实现涉及到话语权的终极追求。

  理想是美好的,道路是曲折的。

  现在没有话语权,想要依靠一些狭义知识去换钱是很难的。

  除非是去找一些跟哈佛、牛津同一水准的高校,要他们为林灰背书。

  不过这样一来岂不是成了看别人脸色赚钱?
  呃……最关键的是这么一来七成还是人家的。

  这种为他人做嫁衣的事林灰是不会搞得。

  在没有足够的话语权之前,想靠狭义知识躺在大气层是不可能的了。

  似乎还是老实通过数据标注或者别的现实一点的手段去赚钱好一点。

  即便是数据标注对于林灰来说,运用得当也是一笔巨大的财富了。

  十八世纪末期,在美國的西进运动中,人们在萨克拉门托河里发现了金砂。

  在勇气、贪婪的作用下,工人、农民、海员和传教士,前仆后继,前来淘金。

  这就是赫赫有名的“淘金热”。

  不过在这场轰轰烈烈的西进运动中真正依靠淘金赚到大钱的人却不见得有多少。

  反倒是在淘金热这一过程中另辟蹊径的卖水人赚得盆满钵满。

  “数据标注”这个领域某种程度上就是前世人工智能迅速崛起时的“卖水人”。

  (本章完)