Nucleus(JP)フォーラム

NucleusCMS日本語版ユーザーのためのサポートフォーラムです。疑問が生じたらまずは記事検索をご利用ください。

ログインしていません。

#26 2005-12-18 18:01:04

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

sakuraeさん さんの発言:

明らかに実際のヒット数以上のヒット数が記録されています。
昨日 12/17 のレポートメールが一度に9通来ていたのでこの辺も何か影響しているのかもしれません……。

日付が変わり最初のアクセスがあったときに、アクセスログから各テーブルへデータを格納する仕様になっているので、もしかしたら同時間帯にアクセスが集中し、複数回カウントされたのかもしれません。(MySQLの仕組みについては、まだよく分かっていないことが多くあるので)
12月の月別アクセスログですが、同一のログが複数あるかどうか確認していただけますか?

sakuraeさん さんの発言:

20051217.CSV ファイルが出来ず 2005-12.CSV ファイルが出来ていたのは仕様でしょうか?

仕様です。

sakuraeさん さんの発言:

・アクセスログ画面から解析画面に戻るリンク
・ロボットを除外したログが見られる方法
・RSS のカウントをカウンタに含めないオプション
・(前にもちらっと書きましたが) Google のイメージ検索をキーワード検索と区別する

最初のものについては画面上に常に表示される「Nucleusアクセス解析」のタイトルをクリックすれば戻れます。(もちろんQuickMenuをクリックしてもOKです)
2番目については、ロボット等のNGホストを登録するテーブルを新たに作成することで対応しようと考えています。絞込抽出結果からロボット分を除外するだけなく、月別アクセスログからNGホストを自動的に削除できるようにする予定です。
3番目については、RSSをカウントしないこと自体は簡単なのですが、それに関連して整合性をとるために変更しなければいけない部分の処理がちょっと面倒そうなので保留中です。
4番目については、検索エンジンのホスト名や検索クエリ・文字コード等の必要な情報を、検証した上で具体的に提示していただければ対応します。正直なところ、そういった情報を収集するのが面倒なのでこれ以上手を広げる気はありません。なお、どのような情報が必要かは、NP_Analyze.phpの「// Search engines」をご覧下さい。


hoihoさん さんの発言:

ユーザーエージェントを詐称するロボットはさておき、ユーザーエージェントをちゃんと返すロボットもあるので、未知のロボット、すなわち、robot.phpに未定義のロボットを新たにrobot.phpへ登録するためには、IPアドレスだけでなくユーザーエージェント情報の記録は必須なのではないでしょうか?

前提として、ロボットからのアクセスかどうかは利用者各人が定義した方がいいと考えています。取り合えずWeb上の情報を収集して10個程度のホスト名をロボットと登録していますが、正直なところその定義が正しいかどうかさえ私には判断がつかないぐらいですし。

仮に、$_SERVER['HTTP_USER_AGENT']を利用してロボットかどうかを判断するのであっても、ログの肥大化のことを考えるとユーザーエージェントを残す必然性は感じません。その場合、ロボットからアクセスがあった段階で判別して、ロボットという目印をつければ足りると判断しています。

将来的には「ロボットからのアクセスについてはリファー元の情報を取得できない」という法則をうまく利用して、リファー元のフィールドにロボット名を格納することも考えています。
下記ページあたりを参考にすれば、ホスト名とユーザーエージェントを突き合わせることで、精度の高いものができるのではないかと。
http://tech.bayashi.net/pdmemo/ua.html
ただし、スクリプトを記述するのが面倒くさそうなわりに得るものが少ないと感じているので、私の中で優先順位は低いです。

hoihoさん さんの発言:

他のボットは知りませんが、ns.hatena.ne.jpからのアクセスははてなアンテナ[/url:9ylsrtd0]の巡回ロボットで、「Hatena Antenna/0.4 ([url=http://a.hatena.ne.jp/help]http://a.hatena.ne.jp/help)」というユーザーエージェント情報を返します。

了解です。次のバージョンからは「ns.hatena.ne.jp」をロボットとして登録します。

オフライン

#27 2005-12-18 18:09:23

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

先ほど初めて月別のアクセスログをクリックして気がついたのですが、以下のようなエラーが、月別のアクセスログ (2005-12)の文字の下に表示されます。

mySQL error with query SELECT * FROM nucleus_plugin_analyze_temp ORDER BY allog DESC LIMIT 0,50: Table 'dba003521.nucleus_plugin_analyze_temp' doesn't exist

Warning: mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource in /usr/home/*****/****/*****/nucleus/plugins/analyze/index.php on line 156

ver.0.16


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#28 2005-12-18 18:17:55

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

Z10さん さんの発言:

mySQL error with query SELECT * FROM nucleus_plugin_analyze_temp ORDER BY allog DESC LIMIT 0,50: Table 'dba003521.nucleus_plugin_analyze_temp' doesn't exist

ver.0.16

一度アンインストールした上で、再インストールしてみてください。

オフライン

#29 2005-12-18 21:17:02

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

度重なるリクエストや質問にご回答を頂き、いつも有難うございます。
解析画面へのリンクは気づいていませんでした… :oops: 申し訳ないです。

junさん さんの発言:

12月の月別アクセスログですが、同一のログが複数あるかどうか確認していただけますか?

ログというのは /media/analyze にある CSV ファイルでしょうか?
中を覗いてみましたがログのだぶりはないようです。テーブルの中にある数字、たとえば
nucleus_plug_analyze_robot の arohit などが実際よりも大きすぎる数になっています。
テーブルへの格納の際のエラーのような気がしますので今夜もう一度様子を見てみます。

junさん さんの発言:

4番目については、検索エンジンのホスト名や検索クエリ・文字コード等の必要な情報を、検証した上で具体的に提示していただければ対応します。

どうも有難うございます。情報提示不足で申し訳ございません。検索は

http://images.google.com/imgres

から来ているようです (.com は .co.jp になったり .co.fr になったり国によって異なります)。
クエリは

q=キーワード

の場合と

imgurl=画像ファイルの URI
imgrefurl=その画像があるページの URI

の場合と二種類があります (本当はもっと色々ありますが最低限これだけあればアクセスできるようです)。
前者の場合はそのキーワードを含むページにある画像を探し出して
一覧表示し、後者の場合は実際のページをフレーム表示する形になっているようです。
クエリ q の文字コードの情報はよくわからなかったのですが、
恐らく通常のキーワード検索と同じ物を使用していると思います。
私自身としてはこの二種類を区別せず、単に http://images.google.○○○/imgres のリファラを
「イメージ検索」みたいな形で通常検索と分離できれば充分と考えております。

オフライン

#30 2005-12-19 07:08:34

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

済みません、上で「ログのだぶりはなかった」と書きましたがよく見ると複数記録があることが分かりました。
2005-12.CSV ファイルの中に 12/17 のログが 1〜1023 まであって、それが9回繰り返されていました。
同一のアクセス記録が続けて記録されているのではなく、日付が変わると同時に1日分のアクセスログを移す際
9回書き写しているような感じでした。
12/18分のログも4回記録されていて、ログ移動の際に不安定な様子です。

オフライン

#31 2005-12-19 09:03:08

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

sakuraeさん さんの発言:

済みません、上で「ログのだぶりはなかった」と書きましたがよく見ると複数記録があることが分かりました。
12/18分のログも4回記録されていて、ログ移動の際に不安定な様子です。

うーん、やはりそうでしたか。
月別のアクセスログにおいて「2005-12-18」で検索をかけて「時間」でソートして、最初にアクセスのあった頃のログ(00:01:00前後)を確認してみてください。一番最初に、同一時間に複数回のアクセスがあるならば、ほぼそれが原因と言えると思います。
また、12/18分のログについても、今日のアクセスログを開き「時間」でソートすれば確認できます。

イメージ検索については次期バージョンから対応します。(うまく拾えるかどうか別にして)

オフライン

#32 2005-12-19 09:31:07

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

お返事ありがとうございます。
実は3つのサイトを Nucleus で動かしていまして、全てで NP_Analyze を入れているのですが
ログが重なって記録されているのは1つのサイトだけでした。
このサイトだけが他よりアクセスが多く(訪問者は一日につき 100 前後ですがロボットを含めたログ数は 1000 を超えます)、
またログをメールで送るように設定しています。
他の2つはロボット等含めて一日に 200~300 程度のヒット数しかなく、メールも送らない設定にしています。

0時を挟む辺りのアクセスを見てみたのですが、3サイトともうちのサイトへの訪問者はさほど集中していません
(ロボットも含めて数分に1回アクセスがある程度です)。例えば 12/17 から 12/18 へ移る際の異常のあったサイトのログは

2005-12-17 23:59:29
2005-12-18 00:02:41
2005-12-18 00:07:05

となっていて間が空いています(ちなみに同一ホストの訪問者様でした)。
但しレンタルサーバーですのでサーバー全体としての混雑は不明です(ちなみに3サイトともロリポップでそれぞれ別サーバーです)。
あまり1つのサーバーだけが混んでいるとは考えにくいのでこれが原因ではないと考えていますが…。

以上のことからメール送信の辺りで何かあるのかもと考えています。
今日はメールを送らない設定で様子を見てみたいと思います。

オフライン

#33 2005-12-20 08:18:31

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

上の記事の事後報告です。
昨日はメールを送らない設定で様子を見たところ、ログの移動が正常になされていました。
根本的な原因はよく分かりませんが、しばらくメールによるログ送信の機能をオフにして使用します。

オフライン

#34 2005-12-20 11:49:04

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

現状ではSuper-admin権限をもつ者でないとアクセスログの確認ができませんが、これを一般のメンバーも見られるようにはできないでしょうか?


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#35 2005-12-20 12:01:36

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

sakuraeさん さんの発言:

昨日はメールを送らない設定で様子を見たところ、ログの移動が正常になされていました。

そうですか。ただ、メール送信だけが原因ではないと考えているので、次期バージョンでは日付変更時のチェックを二重にする予定です。
おそらく使用しているサーバによっては、日付変更時に一連のMySQL関係の各種処理やmb_send_mail処理をする際、何らかの条件を満たす場合に時間差が発生して不都合が起きるのだろうと推測しています。

オフライン

#36 2005-12-28 18:10:48

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

最近気づいたのですが、主にgooglebotがやたらと「Ar.2005-08 (*NOT FOUND!)」(日付は実際にあるものから未来のないもの迄いろいろと残してくので調べてみたところ、実際に存在するページ、例えば「Ar.2005-08」にアクセスしても、アクセスページには「Ar.2005-08 (*NOT FOUND!)」と削除されたページへのアクセスがあったかのように表示されます。

また、Technoratiで検索してアクセスしてもyahooなどのように検索エンジン経由と認識されません。
それともうひとつ、作成される「nucleus_plugin_analyze_temp」ですが、このデータサイズが数MBと他のテーブルのデータに比べ飛び抜けて大きいのですが、これはいたしかたないのでしょうか、というのもphpmyadminでデータのバックアップをする際にエクスポートしようにも、このテーブルを選択しないようにしないとエクスポートできないのです。


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#37 2005-12-31 01:25:09

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

NP_Analyze で少々大きな問題が発生したのでご報告いたします。
12/30 にうちのサイトが「ログインしていないとサイト自体が表示できない」という状態に陥りました。
私は常にログイン状態を保つ設定にしていたため当初気づかなかったのですが、
よく見るとログアウト状態では全くサイトにアクセスできず慌てて確認したところ
なぜか NP_Analyze で表示させているカウンタの数字が一日で6万程度回っていました。
カウンタは回っているのですがアクセスログは全くとれない状態でした
(12/30 のアクセスログは NP_Analyze には全く記録されておらず、
もう一つ仕込んでいる Power Phlogger には私自身のアクセスのみが記録されていました)。
このため <%Analyze%> というデータ取得用のタグをコメントアウトしたところ、
ようやくログアウト状態でサイトが表示できるようになりました。

12/29 から 12/30 へ日付が変わるところでちょうどデータが切れていたので
テーブルにデータを書き写す際にアクセス集中や何かでエラーが起きたものと考えられます。
が、30日にログが取得できないままカウンタだけが途方もない勢いで回っていた原因が思い当たりません。
今後のバージョンアップの際の参考にして頂ければと思い、ご報告させて頂きました。

そういえば上で Z10さんがご報告されている件ですが、こちらでもテーブルのデータの肥大を確認しました。
一つのテーブルが何故か20MB程度にまで膨れ上がっていてこれがサイトの停止した原因かもと考えています。
仕方ないので現在は NP_Analyze 自体をアンインストールしています (テーブルデータも一旦削除しました)。

オフライン

#38 2006-01-01 12:05:22

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

今朝年をあけて初めてアクセス解析をひらいたところ、以下のようなエラーメッセージが表示されました。
ふたつのサーバで同様のエラーメッセージとなっています。
アクセスログは正常に表示しています。

今月のアクセス状況 (*2006-01-01 ~ 2005-12-31 : 0日間)
Warning: Division by zero in /home/******l/cgi-bin/nucleus/nucleus/plugins/analyze/index.php on line 291

Warning: Division by zero in /home/******/cgi-bin/nucleus/nucleus/plugins/analyze/index.php on line 293

Warning: Division by zero in /home/******/cgi-bin/nucleus/nucleus/plugins/analyze/index.php on line 294

Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#39 2006-01-03 04:03:42

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

バージョン0.2をリリースしました。以前のバージョンから大きく構成を変えました。不具合はかなり減ったはずなので、正式版と呼んでもいいかもしれません。(致命的なバグがありそうだけど  :twisted: )

以下、主な変更点。

・月別アクセスログを閲覧するか否かをオプション設定で指定できるようにした(※デフォルトは「閲覧しない」)。「閲覧しない」にしておくと、「plugin_analyze_temp」テーブルにデータが格納されず、データベースは肥大化しません。ただし、「/media/analyze/」ディレクトに月別アクセスログのCSVファイルは作成されます。
・日付変更時に、重複カウントが起きないようにチェックを二重にした。
・テーブルとCSVファイルの使用状況を把握できるようにした。(そのうち編集できるようにする予定)
・除外ホスト用に「plugin_analyze_ng」テーブルを新たに作り、ブラウザ上で除外ホストを指定できるようにした。
・RSSへのアクセスをカウント除外できるようにした。(※オプション設定)
・複数月のアクセス解析結果やアクセスログが閲覧できるようになった。

以前のものからバージョンアップする場合は、テーブルを含めアンインストールした上で、再インストールしてください。また「/media/analyze/」ディレクトリにあるCSVファイルも削除した方がいいと思います。

オフライン

#40 2006-01-08 20:12:38

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

0.3にバージョンアップする前にあらかじめ伺っておきたいのですが、データベースの削除が必要なバージョンアップのケースは1.6以前からのバージョンアップの場合のみでしょうか?
それとも、0.2xからもデータベースの削除が必要になるのでしょうか?、また削除したとして、以前のバージョンの利用中にできたデータはもう使い物にはならないのでしょうか?


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#41 2006-01-10 20:40:41

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

0.31にバージョンアップしましたが、<%Analyze%>と記載してある部分にときどき以下のようなエラーがでるようです。すべてのデータを削除した上でクリーンインストールしています。
なお、リンク表示するようにしています。

Warning: mb_convert_encoding(): Illegal character encoding specified in /usr/****/nucleus/plugins/NP_Analyze.php on line 410

phpゆえエラーにフルパスがでてしまうのは仕方がないのかもしれませんが、こういったエラーが閲覧ユーザーに見えてしまうのは結構気になります。<%Analyze%>はheader部分に記載してコメントアウトしてしまっても動作するのかなと思ったら、動作するようです。というか、この先はわからないのですが、<!-- <%Analyze%> -->とやったところで、phpのエラーはコメントアウトしても表示されてしまうのでしょうか?


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

#42 2006-01-11 01:21:49

hoiho
メンバー
From: ぺんなごや
登録日: 2005-10-29
投稿: 15
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

バージョン0.2&0.31で記録される検索ワードの文字化けが発生しています。(以前のバージョンでも発生していたかもしれません)

現在確認できたのは、Yahoo!のトップページ http://www.yahoo.co.jp/ から
"皇帝ペンギンのいる動物園"というキーワードでの検索結果
http://search.yahoo.co.jp/search?p=%B9% ... earch.y=12
からのアクセスで、ログに"皇帝ペンギンのいる動物園"と記録されず、アラビア文字を含んだ判読不能の文字列(ڥ


お~た"ホイホ"こ~いち@ペンギンの森
http://penguinsforest.jp
http://penguinsforest.info (別館)
-------------------------------------------------
ペンギンアート展は次期開催地を選定中
http://penguin-art.com

オフライン

#43 2006-01-11 10:18:44

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

hoihoさん さんの発言:

現在確認できたのは、Yahoo!のトップページ http://www.yahoo.co.jp/ から
"皇帝ペンギンのいる動物園"というキーワードでの検索結果
http://search.yahoo.co.jp/search?p=%B9% ... earch.y=12
からのアクセスで、ログに"皇帝ペンギンのいる動物園"と記録されず、アラビア文字を含んだ判読不能の文字列

オフライン

#44 2006-01-11 23:02:59

hoiho
メンバー
From: ぺんなごや
登録日: 2005-10-29
投稿: 15
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

指示どおり修正したところ問題は解決しました。ありがとうございます。

junさん さんの発言:

サーバに入っているPHPのバージョンによって「mb_convert_encoding」の動作が異なるのかもしれません。

2バイト文字系の処理って、ややこしいですねぇ sad

P.S.
ウチのサイト、ネタがネタだけにYahoo!きっず :shock: からの検索で来る人(というより、来る子かな big_smile )も多いんですよ smile これも記録出来るようにするってのは、無理ですかねぇ :?


お~た"ホイホ"こ~いち@ペンギンの森
http://penguinsforest.jp
http://penguinsforest.info (別館)
-------------------------------------------------
ペンギンアート展は次期開催地を選定中
http://penguin-art.com

オフライン

#45 2006-01-12 00:40:16

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

リファー元の取得方法を全面的に書き換えたり、Yahoo!検索ワードの文字化け対策等を施した上で、バージョン0.32にアップしました。

hoihoさん さんの発言:

ウチのサイト、ネタがネタだけに[url=http://kids.yahoo.co.jp/]Yahoo!きっず[/url:1qg1s0ej] :shock: からの検索で来る人(というより、来る子かな big_smile )も多いんですよ smile これも記録出来るようにするってのは、無理ですかねぇ :?

うまく動作するかどうか分かりませんがYahoo!kidsも追加しておきました。

オフライン

#46 2006-01-15 10:24:41

hoiho
メンバー
From: ぺんなごや
登録日: 2005-10-29
投稿: 15
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

junさん さんの発言:

うまく動作するかどうか分かりませんがYahoo!kidsも追加しておきました。

ありがとうございます。ご報告が遅れましたが、先の修正も含めて問題なく動作しております。

早速今からver.0.33に更新してみます smile


お~た"ホイホ"こ~いち@ペンギンの森
http://penguinsforest.jp
http://penguinsforest.info (別館)
-------------------------------------------------
ペンギンアート展は次期開催地を選定中
http://penguin-art.com

オフライン

#47 2006-01-15 17:06:10

sakurae
メンバー
登録日: 2004-09-26
投稿: 105
ウェブサイト

Re: NP_Analyze(※アクセス解析プラグイン)

サイトにコメント投稿があった時、突然ログがリセットされる不具合があるようです。
具体的に言うとコメント投稿を受け付けた途端、本日のアクセスログが
「今月の」ログファイルではなく独立したログファイルとして /media/analyze に記録されてしまい、
再度今日のアクセスログをゼロから取り始めるという現象です。
私のサイトで2回確認していて、1回は1970-01.csv というファイルが生成し、
もう1回は 1999-11.csv というファイルが出来ていました。
このログファイルの記録を見るとコメントページへのアクセス時刻が「0000-00-00 00:00」と記録されていましたので
その辺に原因があるのかと思うのですが…。

あと気づいたのですが、infoseek のサイト (検索ではなく infoseek でスペースを借りて作られている個人のサイト) からのアクセスが
検索エンジンからのアクセスとして一緒に登録されてしまっているようです。
qt クエリのあるなしで区別できるかと思うのですが自分があまり infoseek を使わないので自信ないです :oops:
あと、以前お願いした Google のイメージ検索が何故かうまく取得できていません。
お願いばかりでは申し訳ありませんので自分の方でももう少しコードを動かしてみるつもりです。

オフライン

#48 2006-01-15 18:57:47

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

コメント投稿時のバグ修正や検索エンジン対策等を施した上で、バージョン0.331にアップしました。コメント投稿時の不具合や、infoseekの個人サイトからのアクセスについても対処できたと思います。

sakuraeさん さんの発言:

あと、以前お願いした Google のイメージ検索が何故かうまく取得できていません。

どうしてでしょうかね。ちょっと原因が分かりません。

オフライン

#49 2006-01-17 14:46:29

jun
メンバー
登録日: 2004-02-07
投稿: 345

Re: NP_Analyze(※アクセス解析プラグイン)

[size=150:1magh7bm]【重要】

このプラグインはアクセス解析だけでなく、カウンター表示も可能となっています。しかし、アクセスログファイルが肥大化し、かつ、一時的にアクセスの集中が生じた場合など、サイトの表示が物凄く重くなります(※場合によってはMySQLが「Connect Error」状態になりサイトが表示されなくなる)。

このような場合は、カウンター表示をやめて、アクセス解析機能のみを使えば状況が改善される可能性があります(あるいは<%if(loggedin)%>を使って管理者だけが閲覧できるようにするとか、特定のページでのみ表示するとか)。なお、カウンター表示をやめても効果がない場合は、アクセス数がサーバの処理能力を超えている可能性が高いと思われます。

と、このようなことを書くのは、昨夜から本日にかけて、とあるサイトにおいて実際に支障をきたしたからです。サイト表示に支障をきたすだろう目安を書いておきます。(サーバ側でMySQLへの同時接続数の上限が決められているので、利用しているレンタルサーバによって異なってきますが)
・一日のページビューが10,000を超え、かつ、
・一時間あたりのページビューが2,000を超えた場合

昨夜から本日にかけておこったことについては下記ページを参照。
http://nucleus.mz-style.com/item/819

オフライン

#50 2006-01-18 12:00:17

Z10
メンバー
From: 神奈川
登録日: 2005-06-30
投稿: 228

Re: NP_Analyze(※アクセス解析プラグイン)

NP_Analyzeリリース当初より、HitとPVについて疑問に思っていることがあります。
一般的にはHitはページ中に含まれる画像のリクエストを含んだ数で、PVはhtmlなどのページ単位での数と認識されていると思うのですが、なぜNP_Analyzeではこれを逆にしているのでしょうか?、というかNucleus制作のサイトの場合正確なページ単位数を把握しづらいのでしょうか?

以下は私がNucleus制作しているサイトのNP_AnalyzeによるHitとPVのデータですが、多くのページは1ページ中におよそ5点ほど画像を含んだものとなっており、HitとPVを逆にしてログを解釈すれば話が通じます。
Hit:600 PV:3,084 は PV:600 Hit:3,084となるのが普通なのではないかと思うのです。


Kilax.org
http://kilax.org
Kilax : Nucleus HTML5 w/Responsive Skin
http://kilax.org/blog/catid_2-itemid_3.html

オフライン

Board footer