?

网页中如何使用title

最佳答案

使用Replace Pioneer更改B目录下的html标题,使其包含A目录下相似html标题的详细步骤如下: 注意:你说的相似标题,因为很难区分关键字和非关键字,所以这里用字符串相似性函数来实现,凡相似性超过70%的就认为相似。 1. 把A目录下的所有html文件的title放入系统字典中 (1)ctrl-h打开replace窗口 在search for pattern输入<title.*?>(.*?)</title>@(不带双引号) 在replace with pattern输入set_value(\\\\\\\\1,1)(不带双引号) (2)点击Batch打开Batch Runner窗口 把A目录下的html文件拖拽到Batch Runner窗口中 选中Set output filename选项,把后面的${FILENAME}删除,即清空 (3)点击Batch Replace即可。 (4)关闭Batch Runner窗口,把鼠标放到屏幕中间字典的图标上,能看到网页标题都收录了。 2. 对B目录下的所有html文件的title作修改,使其包含A目录下相似html标题 (1)ctrl-h打开replace窗口 * 在search for pattern输入(<title.*?>)(.*?)(</title>)@(不带双引号) * 在replace with pattern输入\\\\\\\\1$A\\\\\\\\3(不带双引号) 点击Advanced选项页: * 在Run following at the beginning of the replace输入: sub similarity { my ($w1,$w2)=@_; my $l=length($w1)+length($w2); return 0 if ($l==0); return ($l-ldist($w1,$w2))/$l*100; } sub ldist { my @s = split //, shift; my @t = split //, shift; return scalar @t if scalar @s == 0; return scalar @s if scalar @t == 0; my (@prevColumn, @currColumn); @prevColumn = 0..scalar(@t); for my $s (0..$#s) { @currColumn = ( $s + 1 ); for my $t (0..$#t) { push @currColumn, min( $currColumn[$t] + 1 , $prevColumn[$t+1] + 1 , $prevColumn[$t] + ($s[$s] eq $t[$t] ? 0 : 1) ); } @prevColumn = @currColumn; } pop @currColumn } * 在Run following for each matched unit输入: $A=$var[2]; for(keys %dictionary) { if (similarity($_,$var[2])>70) { $A=$_|$A; last;} } (2)点击Batch打开Batch Runner窗口 把B目录下的html文件拖拽到Batch Runner窗口中 (3)点击Batch Replace即可。 注意: 1. 一定要提前备份所有待处理的html文件,以防操作失误。 2. 如有哪步执行有问题请及时与我联系,不要关闭该问题。 补充: 以下是修正版的similarity函数,把更多无关词去掉,试试看相似度能否提高?注意你自己要再加词的话,要把长的词排在前面才能达到更好的效果。 sub similarity { my ($w1,$w2)=@_; my $common=怎么样|为什么|最有效|有效果|怎么办|怎么|效果|如何|怎样|什么|快速|有效|效果|才能|方法|可以|多少|健康|最好|多长|时间|办法|哪里|如果|推荐|知道|好吗|大家|谢谢|问题|最近|而且|产品|作用|牌子|指教|允许|真正|那么|自己|容易|干嘛|好象|办法|情况|好处|喜欢|东西|做|好|吗|的|下|哈|啊|最|能|才|去|个|有|假|真|会|谁|太|非|常|能|钱|么|呢|让|阿|谁|一|两|个|月; $w1=~s/$common|\\\\\\\\W+//g; $w2=~s/$common|\\\\\\\\W+//g; my $l=length($w1)+length($w2); return 0 if ($l==0); return ($l-ldist($w1,$w2))/$l*100; }

88 位用户觉得有用)
 

相关问答

 

最新问答

 

问答精华

 

大家都在问