したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | |

集計人養成ゼミ

782名無しさん:2007/02/14(水) 20:10:19
>>781に持っていくにも細かくてうぜーので、ココに書かせてもらいますね。

集計スクリプトでちょっと具合の悪いことになったので報告します。
といっても、かちゅ〜しゃだけの現象だと思うのですが。
かちゅ〜しゃで集計してる人はいるのか?

●2/13のギャルゲの投票で、こんなのがありました。(色々と略してます)
両方とも無効になるのを意図してるものです。

<<候補A>40
<候補B>>45

●このとき、かちゅ〜しゃのdatはリンクを書き込んでいるので以下の通り。

&lt;&lt;候補A<a href="〜略〜" target="_blank">&gt;40</a> <br> &lt;候補B<a href="〜略〜" target="_blank">&gt;&gt;45</a>

●集計スクリプトで、まず抽出されるキーワード。←<<>>に囲まれている部分

候補A<a href="〜略〜" target="_blank">&gt;40</a> <br> &lt;候補B<a href="〜略〜" target="_blank">

●その後、埋め込まれた<a>タグを以下の正規表現で外している。

 $tmpkey =~ s/<a href=.*blank\">//;
 #check1.pl:142,check2.pl:245,checksub.pl:429 489

●この変換をした後に、<br>の有無をチェックして、キーワード内改行禁止の場合は破棄する。
●さて、さっきのdatをこの正規表現に通すと

候補A

ということになって、改行や他の文字も消されてしまう。
つまり、キーワード拾っちゃうんです。

●私自身は、*を最小マッチに、全体を繰り返しマッチにして対処しました。
場所はcheck1.pl:142行、check2.pl:245行、checksub.pl:429行 489行

 $tmpkey =~ s/<a href=.*?blank\">//g;

多分これで大丈夫だと思うんですけど、なんか副作用があったりしても困るんで、当分運用してみようと思ってます。
これでよかったら本家に入れてもらおうかと思ってるんですけど。
この変更が影響を及ぼすのはかちゅ〜しゃだけですかねえ?


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板