网页的本质就是超级文本标记语言,通过结合使用其他的Web技术(如:脚本语言、公共网关接口、组件等),可以创造出功能强大的网页。因而,超级文本标记语言是万维网(Web)编程的基础,也就是说万维网是建立在超文本基础之上的。超级文本标记语言之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。
本篇文章给大家带来的内容是关于php analysis如何提取关键字?(代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
最近在开发一个文章模块功能,设计那边提出要给文章生成对应标签,用于文章关联推送,这里和大家分享一下实现过程;
这里需要用到PHPAnalysis,下载链接如下
链接:https://pan.baidu.com/s/1GBbAn-LGcNeOgeV62XSUeg
提取码:xzmx
提取关键字方法如下:
<?php/**
* 关键字提取方法
*
* @param $title string
* 进行分词的标题
* @param $content string
* 进行分词的内容
* @return array 得到的关键词数组
*/ function getKeywords($title = "", $content = "") {
if (empty ( $title )) {
return array ();
}
if (empty ( $content )) {
return array ();
}
$data = $title . $title . $title . $content; // 为了增加title的权重,这里连接3次
//这个地方写上phpanalysis对应放置路径
require_once './phpanalysis/phpanalysis.class.php';
PhpAnalysis::$loadInit = false; //初始化类时是否直接加载词典,选是载入速度较慢,但解析较快;选否载入较快,但解析较慢
$pa = new PhpAnalysis ( 'utf-8', 'utf-8', false );
$pa->LoadDict (); //载入词典
$pa->SetSource ( $data ); //设置源字符串
$pa->StartAnalysis ( true ); //是否对结果进行优化
$tags = $pa->GetFinallyKeywords (4); // 获取文章中的五个关键字
$tagsArr = explode (",",$tags);
return $tagsArr;//返回关键字数组 }