字段基础配置

数据 [标题 或 内容] 识别规则 [必填]

根据所填写的标题格式在字符串中匹配与之对应的内容。请注意这个是正则匹配。所以当你的正则无法匹配到内容时请确认所填写的正则表达式是否正确。检查正则边界条件是否满足,规则配置操作实例可以参看功能介绍-云采集引擎-数据链接-链接配置-基础配置中查看

格式: STR1[subject]STR2
通配符: ( * )

示列1:
数据[标题 或 内容]识别规则:

<i class="icon-arrow-right"></i></a>*<a href="/article/*>[subject]</a>* <div class="span1 votecell">

识别内同为:

声 明

下面为待识别区域的部分源码:

<div class="btn-group pull-right">
                    <span class="btn disabled"><i class="icon-arrow-left"></i></span>
                                    <a href="/article/110929" class="btn"><i class="icon-arrow-right"></i></a>
            </div>
            <h1>
                <a href="/article/110853">声 明</a> 
            </h1>
        </div>

        <div class="row">
            <div class="span1 votecell">
                <div id="votediv" class="vote">

识别规则一定要符合前后唯一特性。这样才能将正确内容识别出来

数据[标题 或 内容]过滤规则 [可选]

过虑规则只是将你所填写的字符去掉。区分大小写。多个字符可用 | 通配符隔开

通配符: ( * ),( | )

注意下面示例中原本内容为:
<p>此书电子版免费供大家下载阅读,如果您已为此副本付费,请立即申请退款并联系作者举报此行为。请注意,虽然此书电子版免费供大家阅读,但这并不代表作者放弃了版权,您在未经授权的情况下依然不得以任何方式复制或抄袭本书内容。此书的电子版目前仅授权图灵社区和百度阅读两个平台发布,如果您通过其他渠道获取到了此副本,则是侵权行为,请到上述两个平台下载合法授权的副本。获取合法授权副本的好处是可以及时得到此书的最新版本,早期版本中的错误会被及时纠正。感谢您对版权保护工作所做出的贡献。 </p>

无通配符

示例2:
数据[标题 或 内容]过滤规则:

<p>此书电子版免费供大家下载阅读

过滤后的结果 如下:

,如果您已为此副本付费,请立即申请退款并联系作者举报此行为。请注意,虽然此书电子版免费供大家阅读,但这并不代表作者放弃了版权,您在未经授权的情况下依然不得以任何方式复制或抄袭本书内容。此书的电子版目前仅授权图灵社区和百度阅读两个平台发布,如果您通过其他渠道获取到了此副本,则是侵权行为,请到上述两个平台下载合法授权的副本。获取合法授权副本的好处是可以及时得到此书的最新版本,早期版本中的错误会被及时纠正。感谢您对版权保护工作所做出的贡献。 </p>

通配符 |

示例3:
数据[标题 或 内容]过滤规则:

<p>|</p>

过滤后的结果 如下:

此书电子版免费供大家下载阅读,如果您已为此副本付费,请立即申请退款并联系作者举报此行为。请注意,虽然此书电子版免费供大家阅读,但这并不代表作者放弃了版权,您在未经授权的情况下依然不得以任何方式复制或抄袭本书内容。此书的电子版目前仅授权图灵社区和百度阅读两个平台发布,如果您通过其他渠道获取到了此副本,则是侵权行为,请到上述两个平台下载合法授权的副本。获取合法授权副本的好处是可以及时得到此书的最新版本,早期版本中的错误会被及时纠正。感谢您对版权保护工作所做出的贡献。

通配符 *

示例4:
数据[标题 或 内容]过滤规则:

此书电子版免费供大家下载阅读*请到上述两个平台下载合法授权的副本

过滤后的结果 如下:

<p>。获取合法授权副本的好处是可以及时得到此书的最新版本,早期版本中的错误会被及时纠正。感谢您对版权保护工作所做出的贡献。 </p>
Copyright © finndy.com all right reserved,powered by Gitbook__ 2013-2017