标签:
野生程序猿 | 发表时间:2020-10-13 21:23:56 | 更新时间: 2020-11-26 13:46:22 | 阅读数:633 | 评论数:0 | 字数:648
本站每篇博客均有一个“字数”的数据信息。这个数据最开始是通过手工统计的——说起来不怕笑话——是将博客内容复制到ms word里面,再用word的字数统计功能统计出字数,再填写到博客的字数信息里。虽然操作起来也不算麻烦,几秒钟就能搞定。但是一来显得太低端,二来若对博客进行编辑,上述操作需要重复进行。若编辑的次数多,就显出效率低下了。
一直想要实现字数自动统计的功能,今天终于腾出手来实现了,下面是
统计HTML中字符数的函数。
Public Function GetHtmlWordsCount(HtmlString As String) As Integer
Dim regex As Regex = New Regex("<(.|\n)+?>")
'去除空格
HtmlString = Replace(HtmlString, " ", "")
'去除回车
HtmlString = Replace(HtmlString, vbCrLf, "")
HtmlString = Replace(HtmlString, Chr(10), "")
HtmlString = Replace(HtmlString, Chr(13), "")
'去除HTML标签
HtmlString = regex.Replace(HtmlString, "")
'返回字符数
Return Len(HtmlString)
End Function
需要说明的是,上面这个函数得到的是
字符数,而非
字数。区别在于前者将诸如“
abcdefg”计作7个字符,而后者记为1个字,如下图所示。因为这个差别,本站的字数统计由39万增加到了53万。呵呵呵~