应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

重新定义爆款文内容价值标尺越来越多元

  基于内容特征以及协同过滤算法机制的推荐系统,使优质草根难以有出头之日。关于内容价值的高低,不能一直靠冷冰冰的算法来判定,长此以往,只会使内容生产流水线化,好内容消匿在所谓的爆款文浪潮中。微信新提出的新的热度预测模型DETC,将改变这种现状,促进内容价值判定标准多元化,重新定义爆款文。
  没有一个时代比今天更重视技术对于内容的价值。
  越来越多的人们,尤其是年轻人,更加愿意使用和相信算法生成和推送的内容。算法之于文章,扮演的就是一个星探的角色。它需要在刚刚见面的几分钟内,就判断出哪个具有明日之星的潜力,以便分配更多的资源帮助它走花路,而不是只会在对方走红之后,才说出我早就知道的马后炮。
  不幸的是,大部分基于内容特征和协同过滤算法的推荐系统,都无法识英雄于微时在文章发出早期就判断出其受欢迎程度。这就导致一些原本质量很高的文章,很可能因为初始浏览量不够而被埋没,标题党咪蒙系反而有可能得到越来越多的推荐和热度。
  如何在过剩的信息洪流中将用户最感兴趣、最具潜力的资讯率先甄选出来,是建立一个良性内容生态的关键,却也是困扰各大巨头、悬而未决的技术难题。
  最近,微信的研究人员就提出了一种新的神经网络方法DFTC,用来更好地预测网络文章的热度。由于该模型表现出了良好的性能,已经被AAAI2019大会接收,并在大会上作了主题报告。
  它在哪些领域进行了创新?又能为现有的爆款内容生产机制带来哪些改变呢?渠道分发哪家强?热度预测又面临哪些难题?
  在介绍新方法之前,有必要先梳理一下,当前的推荐算法都是如何进行热度预测的?
  如何进行热度预测
  一种是基于聚合浏览量的时间演进过程,比如:今日头条的热门推荐算法,就是优先推荐热门的文章。
  这种方式的优势是:已知的历史热度会越来越接近整体受欢迎程度,因此,模型的表现也会随着文章发布的时间而变得越来越好。
  但由于很多外部因素带来的意外增长,都是不可预测的,时间热度模型却对此却无能为力。即使引入人工干预,除非像咪蒙系一样凭借大量经验和策划,否则也很难确定爆款文章可能出现的时间,以及生命力有多强。
  二是通过预测内容特征的受欢迎程度,来推断整体可能的热度。
  YahooToday就曾经用新闻的点击率来进行画像,并用featurebasedlearning方法来建模用户对资讯感兴趣的程度。
  其中包括静态特征,比如:资讯的类目、主题等;以及动态特征,如某条资讯、某类资讯分时间段的各种统计值等。
  通过这种方法,Yahoo发现在推荐新闻时,娱乐类新闻天然比体育类新闻点击率高。
  由于内容特征不会随着时间而变化,因此很多不那么刺激眼球的内容,也可以获得公平的曝光机会,使得该模型在早期阶段效果更为可靠。
  但问题也随之而来,网络文章通常是长文本,加上越来越复杂的元数据特征(如标题、类别、作者信息等),建模难度也日渐增大,目前还没有此类模型能够完全地利用这些数据。
  不难发现:不论是基于时间演进,还是基于内容特征,都不足以支撑内容终极价值的判断标准。只有双管齐下,才能发挥出最佳的预测效果。然而,这对于算法工程师来说是极大的挑战。
  DFTC:改写热度预测的丛林法则
  为了改变这一现状,微信的研究人员就此提出了一种将时间过程,与内容特征深度地融合到一起的神经网络方法DeepFusionofTemporalprocessandContentfeatures,简称DFTC,来构建更合理的热度预测系统。
  他们收集了2018年5月7月的6万篇微信公众号文章的热度数据,将文章热度分为3类:爆款(阅读量amp;gt;10000),冷门(阅读量amp;lt;100)和普通(其它)。最终得到一个类别基本平衡的数据集用作训练(trainingset)和测试(balancedtestset),并建立了一个2万篇文章构成的随机测试集(randomtestset)。
  DFTC一共包含三个部分:
  时间过程建模;
  内容特征建模;
  注意融合。
  首先,采用卷积神经网络(AttentionCNN)来提取文章增长和下降的短期波动情况,比如:一篇文章每小时浏览量的变化情况。
  接着,再利用循环神经网络(RNN)得出文章受欢迎程度的长期增长趋势。
  然后,利用分层注意网络(HAN)来获取文本特征,使用嵌入技术来学习各种元数据的特征,并进行建模,得到一个内容特征模型。
  接下来,将建好的时序模型和内容模型利用注意力机制,动态地组合到一起,生成一个能够体现出文章热度演变过程多样性的灵活权重(Popularitylevel)。
  DFTC的创新之处是,解决了三个悬而未决的行业难题:
  如何预测意外情况带来的短期波动(AttentionCNN自动学习短期波动,不做具体假设或人工设计);
  如何解决元数据多模态的识别难题(embedding技术可以识别短文本描述、标题和图像等多种表现形式);
  相同内容特征与不同生命周期阶段的连接(Attention融合机制,生成一个灵活权重而非线性组合)。
  至此,一个更优秀的热度预测模型就诞生了。
  实验数据显示:两手抓两手都要硬的DFTC,在文章发布后的前5个小时,其预测的准确度相比其他单一性解决方案强出了不少。
  不难发现:DFTC正是基于对短期浏览量、意外因素、内容关键词等可能,决定最终受欢迎程度的多重因素进行了全面统筹,才能在初始期就做出更精准的判断。
  因此,一些枯燥无趣的内容会被率先过滤掉,有潜力的优质文章也更容易得到推荐,避免了酒香也怕巷子深的命运。
  或许不久以后,依靠经验和直觉打造爆款,和依靠大数据与关键词打造爆款,这些技术蛮荒时代的丛林法则慢慢都会被更好的生态机制所取代。
  热度预测照亮的未来,不只属于文字。
  个性化推荐系统既不能完全遵循用户兴趣标签与内容特征抽取的匹配,那会导致越来越严重的信息茧房(喜欢你就多看点)和回声室效应(你反对的绝不出现);也不能单纯依靠文章的生命周期来判断,让优质创作者在平台偏向(这篇会火都给我看)之下凉了热血。
  因此单纯从数据上看,DFTC是成功的。
  目前,微信已经将该模型作为系统选择和推荐文章的重要依据,开始在看一看等产品场景中进行实践。
  从更广泛的实用性来说,DFTC所代表的思路,用深度学习技术和思维解决预测问题,正在成为业界共识。
  在任意时间预测网络内容的最终热度,DFTC不仅仅只有资讯平台的推荐算法,在广告、搜索等业务也能起到很强的推动作用,提高内容的分发效率。
  而就在前不久,微软也提出过一个跨产品的用户行为模型,将用户在搜索、新闻、appstore、xbox等多个产品线上的行为(反馈)统一在一起。这样训练出的深度学习网络,就能很好地优化和解决单个产品上(用户)冷启动、信息稀疏等问题。
  也就是说:可能你搜索了房价会不会继续上涨,打开新闻APP就会收到房价可能回到三年前的新闻,是不是有点细思极恐呢?
  这也反映出深度学习进行热点预测所呈现的新的问题:
  平台对热点的评估只是一种模仿,好的阅读体验究竟应该如何量化?
  为了更好的阅读体验,读者需要让渡多少个人隐私?
  当然,现在想这些还有点为时过早。无论如何,热度预测模型能力的升级,正在让内容产业关于价值的标尺越来越多元,这可能是算法最具人性的一次。

孕妇缺碘对胎儿会有什么影响看过你就明白了对于碘可能是人们常常被忽略的问题吧,但是碘元素无论是对于孕妇还是胎儿都是极其重要的一种微量元素,那么,孕妇缺碘对胎儿会有什么影响?看过你就明白了!下面就让本站小编来介绍吧!……保管承诺书范本参考多篇概述:保管承诺书范本参考多篇2020为好范文网的会员投稿推荐,但愿对你的学习工作带来帮助。保管的意思就是指担保,保证;对物品进行保存及对其数量、质量进行管理控制的活动。以……口味一流饥饿营销手抓饼生意火千层百叠、面丝千连,外层是淡淡的金黄色,内层柔软白嫩这是手抓饼。黑框眼镜、身材高瘦,终日系着围裙,却是计算机信息管理专业出身这是禹化普。短短两年,这个生于1990年的年轻……外婆夸我长大了生活是一团麻,但摩擦并无解。滤过其中的不悦,感受到的只有那份只有童年才有的无忧无虑和梦幻般的清纯与天真小时候,我会依偎在外婆的怀里撒着娇说:外婆,外婆,给小幸讲个故事嘛!……黑苦荞茶能长期喝吗可以。黑苦荞茶所含芦丁可软化血管、具有降血脂、降血糖、降血压,减肥败毒,清理人体垃圾,激活胰岛素分泌等功效。富含蛋白质矿物元素和人体必须的9种脂肪酸、亚油酸等生物活性物质……什么一直都在它一直都在落日的余晖渐渐消失在地平线上,窗外的树渐渐穿上了青黛色的外衣。一直压抑着的情绪奔涌而出,泪水止不住地哗哗往下流,中午的一幕幕又呈现在我的脑海里我宣布,这次……隔音板是什么材料做的隔音板是一种作用于隔音效果的版块。有建筑物隔音与构筑物隔音分类。隔音板并不是所有频率的声音都能阻隔,物体都有固有共振频率,接近物体共振频率的声音,隔音板的隔音效果显著降低。……如何有效预防产后脱发产后脱发,是许多产后妈妈都遇到过的现象,在此,小编提醒这些脱发的新妈妈,产后脱发不必惊慌,保持良好的心态,及时补充营养即可恢复,总体说来,想要预防产后脱发,新妈妈应该要做到以下……我的好朋友在学校里,我认识了好多的好朋友,其中,我最喜欢我的好朋友小代。代宝宝他皮肤跟美国人一样,白白的,他有一双千里眼和小鼻子,红红的小嘴巴,一双顺风耳。他中等个子,因为他长得跟……不同年龄段老人的健身方法随着年龄增长,很多人的运动量也随之减少,老年学者认为,坚持运动对老年人维持身体健康和独立生活至关重要。专家则认为,锻炼对治病的功效几乎等同于口服药物。当然,人体的自然老化过程会……杏坛魂上之三转眼已过了大半个学期,离元旦也只有十天了。学校发出了通知:音乐、美术、劳技等副课必须在元旦前完成学生期末成绩的考评,以便在元旦后将这些课程的教学时间让给其它语、数、外等主课。体……高血糖应该注意吃什么食物当血糖值高于正常范围即为高血糖。高血糖患者需要尽早的治疗,尤其是在饮食上更加要注意,那么高血糖应该注意吃什么食物?本站给大家详细的介绍一下。1、主食一般以米、面为主,但是……
希求造句用希求造句大全【希求xqi】:1。谋求;企求。一、不要无事讨烦恼,不作无谓的希求,不作无端的伤感,而是要奋勉自强,保持自己的个性。德莱塞二、她现在除了念书,没有别的希求。三……与家长谈谈孩子的才艺学习之路据《亲子》杂志的一项专题调查发现:83。9的父母认为要对孩子进行才艺培养,近80的父母希望让孩子参加不止一项的才艺训练。我们的父母总是一切为了孩子,经济上稍一富裕,就尽力为孩子……方脸化妆有技巧你学会了吗方脸化妆有技巧,你学会了吗方脸化妆技巧有十步,方脸的妹子快来学学吧。第一步:面对镜子,把眉刷平放在眉毛上方,观察两侧眉峰的高度,如果两侧眉峰的高度差没有超过0。3厘……西峡老君洞西峡老君洞野人洞怎么去?这两天关于西峡老君洞:西峡老君洞野人洞怎么去?在网上的热度是非常高的,很多网友们也都是非常关注西峡老君洞:西峡老君洞野人洞怎么去?这个事情,为此小编也是在网上进行了一番搜索查阅……小小动物园我的家是一个动物园,是一个和谐友好的动物园。我的爸爸是一头庞大的非洲象。他高高的,胖胖的,皮肤被晒得很黑,所以他才不是一只普通的大象,而是跟他肤色相似的非洲象。爸爸也是我……西峡最近旅游点从谷城到西峡最近咋走?这两天关于西峡最近旅游点:从谷城到西峡最近咋走?在网上的热度是非常高的,很多网友们也都是非常关注西峡最近旅游点:从谷城到西峡最近咋走?这个事情,为此小编也是在网上进行了一番搜索……我准备自驾去西安,路过河南,求河南自驾游线路和景点?这两天关于我准备自驾去西安,路过河南,求河南自驾游线路和景点?在网上的热度是非常高的,很多网友们也都是非常关注我准备自驾去西安,路过河南,求河南自驾游线路和景点?这个事情,为此……妊娠斑什么时候能消呢妊辰斑是生活中准妈妈们担忧的问题,因为害怕自己也出现这样的情形,这样的话就会使自己的形象也遭受到一定的损害,时间长了的话,还可能会导致心理也产生问题的,在生活中大家也知道一些去……欧元区的重启与全球再平衡欧债危机之后的欧元区在重走2000年互联网泡沫之后德国的结构调整之路,但它是建立在全球失衡基础上的。2008年金融危机之前,欧元区的国际收支状况整体上是平衡的,但内部结构……腾讯手游地下城与勇士将延期上线文章来源:科技讯腾讯旗下游戏《地下城与勇士》手游运营团队在官微宣布因游戏内防沉迷系统需要进行升级原定于8月12日全平台上线的《地下城与勇士》手游将延期具体上线时间将在后续……dnf怎么增幅装备(dnf怎么精炼装备)作者:月月樱在如今版本,增幅绝对已经成为每一个玩家提升自己的必经之路,以前高不可攀的红字变得平民化。不过话虽如此,想要获得一身高增幅的装备也是有一定难度的。所以今天就让我……热文养胃吃什么食物最好吃什么东西可以养胃?近日养胃吃什么食物最好吃什么东西可以养胃?登录上了百度热搜,受到广大网友们的关注,那么关于目前的养胃吃什么食物最好吃什么东西可以养胃?相信小伙伴们都是想要了解到最新的信息吧,小……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网