JP2008158589A - Updated information notification device, and updated information notification program - Google Patents
Updated information notification device, and updated information notification program Download PDFInfo
- Publication number
- JP2008158589A JP2008158589A JP2006343520A JP2006343520A JP2008158589A JP 2008158589 A JP2008158589 A JP 2008158589A JP 2006343520 A JP2006343520 A JP 2006343520A JP 2006343520 A JP2006343520 A JP 2006343520A JP 2008158589 A JP2008158589 A JP 2008158589A
- Authority
- JP
- Japan
- Prior art keywords
- update information
- data
- update
- unit
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 12
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、更新情報通知装置及び更新情報通知プログラムに係り、特に、クライアントコンピュータからのWebデータ取得要求に応じてWebサーバから取得したWebデータの更新情報を通知する更新情報通知装置及び更新情報通知プログラムに関する。 The present invention relates to an update information notification device and an update information notification program, and more particularly to an update information notification device and update information notification for notifying update information of Web data acquired from a Web server in response to a Web data acquisition request from a client computer. Regarding the program.
従来より、ネットワーク上のWebサーバ等へのアクセス時に、ネットワークのトラフィックを低減させてレスポンスを向上させるための様々な方法が提案されている。例えば、企業などにおいて最も一般的に用いられているのが、プロキシサーバ(Proxy Server)を用いる方法である。プロキシサーバは、Webアクセスの際にサーバを経由させることで、企業内から同じWebサイトへのアクセスの応答を代理する機能を提供するものである。プロキシサーバは、一時的にWebページのキャッシュを保持し、その情報が更新されていなければ、クライアントコンピュータ(以下、単にクライアントという)からのWebページデータの要求に対して代理で応答するため、インターネットアクセス時のトラフィックを下げ、レスポンスを高める働きをする。 Conventionally, various methods have been proposed for improving response by reducing network traffic when accessing a Web server or the like on a network. For example, a method using a proxy server is most commonly used in companies. The proxy server provides a function of proxying an access response to the same Web site from within the company by passing the server through the server during Web access. The proxy server temporarily holds a cache of a web page, and if the information has not been updated, the proxy server responds by proxy to a request for web page data from a client computer (hereinafter simply referred to as a client). It works to reduce traffic during access and increase response.
また、更新されたWebデータだけを取得するために用いられるものとして、Webサイト側から提供されるRSS(RDF Site Summary)データがある。RSSデータは、Webページの更新情報を表現するためのデータであって、XML(eXtensible Markup Language)規格に準拠したRDF(Resource Description Framework)というドキュメント表記規格により、例えば図4に示すような形式で記述される。ここで、図4は、Webサーバから応答されるRSSデータの一例を示す説明図である。図4に示すように、RSSデータ400には、Webサイト内の各リソース(記事、文書など)の更新情報が、<item></item>というタグで囲まれたitemという単位で記述される。また、各itemには、<date>、<title>及び<description>等の項目が含まれる。<date>、<title>及び<description>の各項目はそれぞれ、リソースの更新日時、リソースのタイトル(見出し)及びリソースの要約や概要説明を表す。
Also, RSS (RDF Site Summary) data provided from the website side is used to acquire only updated web data. RSS data is data for representing update information of a Web page, and is in a format as shown in FIG. 4 according to a document description standard called RDF (Resource Description Framework) compliant with the XML (extensible Markup Language) standard. Described. Here, FIG. 4 is an explanatory diagram showing an example of RSS data returned from the Web server. As shown in FIG. 4, in the RSS
このようなRSSデータをWebサーバから取得するために、一般的に、RSSリーダというソフトウェアが利用される。RSSリーダは、ネットワーク上のWebサーバから定期的にRSSデータを取得して閲覧するためのソフトウェアである。ユーザは、RSSリーダを利用することによって、RSSデータが置かれているWebサイトの更新情報を定期的にチェックすることができる。さらに、RSSデータを上述のプロキシサーバ経由で取得することにより、更新があったRSSデータのみ取得することも可能である。 In order to acquire such RSS data from a Web server, software called an RSS reader is generally used. The RSS reader is software for periodically acquiring and browsing RSS data from a Web server on the network. The user can periodically check the update information of the Web site where the RSS data is placed by using the RSS reader. Furthermore, only RSS data that has been updated can be acquired by acquiring RSS data via the proxy server described above.
Webサーバ側でRSSデータの応答に揺らぎを与えると、既読の情報を毎回クライアントに受信させることが可能となる。ここで、RSSデータの応答の揺らぎとは、Webサーバが1回の応答につき10件の更新情報を応答する場合に、常に最新の10件の更新情報を応答するのではなく、2番目から11番目までの10件や3番目から12番目までの10件といったように、クライアントからのアクセスのタイミングによって応答する更新情報を変えるというものである。 If fluctuation is given to the response of the RSS data on the Web server side, it becomes possible to cause the client to receive the read information every time. Here, the fluctuation of the response of the RSS data means that when the Web server responds with 10 update information per response, it does not always respond with the latest 10 update information but instead with the second to 11th update information. The update information to be responded is changed according to the access timing from the client, such as 10 cases up to the 10th and 10 cases from the 3rd to the 12th.
RSSデータの応答の揺らぎについて、図5を参照して説明する。図5は、Webサーバから応答されるRSSデータをクライアント側で蓄積するための従来の方法を示す説明図である。Webサーバは、例えば、item1〜10までのitemにより構成されるRSSデータを保持しているものとする。
The fluctuation of the RSS data response will be described with reference to FIG. FIG. 5 is an explanatory diagram showing a conventional method for accumulating RSS data returned from a Web server on the client side. It is assumed that the Web server holds RSS data composed of
まず、1回目のクライアントからの要求により、Webサーバは1〜5までのitemからなるRSSデータ501を応答する。クライアントは、RSSデータ501に含まれるitem1〜5を更新情報としてRSSリーダに表示させ、RSSデータ501を格納する。次に、2回目のクライアントからの要求時に、Webサーバは2〜6までのitemからなるRSSデータ502を応答する。クライアントは、格納されているRSSデータ501と応答されたRSSデータ502とを比較し、差分であるitem6を更新情報としてRSSリーダに表示させ、RSSデータ502を格納する。
First, in response to a request from the first client, the Web server responds with RSS
さらに、3回目のクライアントからの要求時に、Webサーバは再び1〜5までのitemからなるRSSデータ503を応答する。クライアントは、格納されているRSSデータ502と、応答されたRSSデータ503と比較し、差分であるitem1を再び更新情報としてRSSリーダに表示させる。このように、Webサーバ側でRSSデータの出力がコントロールされることによって、クライアントのRSSリーダにおいて、既読情報が新着情報として表示されてしまうことがある。
Further, at the time of a request from the third client, the Web server responds again with RSS
特許文献1には、上記のような場合に、取得した情報を適切に蓄積することができる方法が記載されている。特許文献1に記載の方法によると、既に蓄積されている情報Aに対し、取得した情報Bとの差分情報Cが検出された場合に、差分情報Cのみを新たな付加情報として情報Aに追加して蓄積するための方法が記載されている。この場合、蓄積される情報Aは、情報A+Cに更新される。これにより、情報を収集する側で大量の情報が重複して記憶されることを防止し、記憶装置に蓄積される情報量を少なくすることができるとともに、本当に更新された情報のみを更新情報として通知することができる。
上述したように、RSSデータを蓄積する場合に、特許文献1に記載の方法を用いると、データが重複しないように蓄積し、適切な更新情報を通知することができる。しかしながら、RSSデータのitemのようにカテゴリや位置などの特定の情報を持たないデータの場合、蓄積した古いitemを削除するためには、時間という判断基準により古い情報を順次削除するといった手法をとる必要がある。その結果、RSSデータに含まれる情報には、長期間蓄積が必要なものと短期間の蓄積でよいものとが混在しているにもかかわらず、全てのデータが一定期間蓄積されるため、必要な情報を効率的に蓄積することができない。
As described above, when RSS data is stored, if the method described in
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、WebサーバからのRSSデータの応答に揺らぎがある場合であっても、更新された情報だけをクライアントに応答し、かつ必要な情報を効率的に蓄積することが可能な、新規かつ改良された更新情報通知装置及び更新情報通知プログラムを提供することにある。 Therefore, the present invention has been made in view of the above problems, and an object of the present invention is to update only updated information even when there is a fluctuation in the response of RSS data from a Web server. It is an object of the present invention to provide a new and improved update information notification device and an update information notification program capable of responding to a client and efficiently storing necessary information.
上記課題を解決するために、本発明のある観点によれば、クライアントコンピュータからのWebデータ取得要求に応じてWebサーバから取得したWebデータの更新情報を通知する更新情報通知装置において、指定されたWebサーバから、Webデータの更新内容を示す更新情報と更新日時とを少なくとも含む更新情報データを定期的に取得する更新情報データ取得部と、過去に取得された更新情報データを格納する更新情報格納部と、更新情報データ取得部によって取得された各更新情報データを、更新情報格納部に格納された格納済み更新情報データと比較し、更新情報格納部に追加するか否かを判断する更新情報比較部と、更新情報比較部により更新情報格納部に追加すると判断された更新情報データを更新情報格納部に格納する更新情報更新部と、更新情報更新部によって更新情報格納部に追加された更新情報データを用いて更新情報通知データを生成し、クライアントコンピュータに送信する更新情報通知データ送信部と、を備える更新情報通知装置が提供される。 In order to solve the above-described problem, according to an aspect of the present invention, an update information notification device that notifies update information of Web data acquired from a Web server in response to a Web data acquisition request from a client computer is designated. An update information data acquisition unit for periodically acquiring update information data including at least update information indicating update contents of web data and update date and time from a Web server, and an update information storage for storing update information data acquired in the past Update information acquired by the update information storage unit and each update information data acquired by the update information data acquisition unit is compared with stored update information data stored in the update information storage unit, and whether to add to the update information storage unit The update information stored in the update information storage unit is stored in the update information storage unit by the comparison unit and the update information comparison unit. Update information comprising: an update information update unit; and an update information notification data transmission unit that generates update information notification data using the update information data added to the update information storage unit by the update information update unit and transmits the update information notification data to the client computer A notification device is provided.
かかる構成により、WebサーバからのRSSデータの応答に揺らぎがある場合であっても、本当に更新(追加)された情報のみを利用者に対して通知することが可能となる。また、更新情報を蓄積する場合に、重複する情報を蓄積することなく、必要な情報を効果的に蓄積することができ、記憶装置に蓄積される情報量を削減することが可能となる。 With this configuration, even if there is a fluctuation in the response of the RSS data from the Web server, it is possible to notify the user of only the information that has been really updated (added). Further, when updating information is stored, necessary information can be stored effectively without storing overlapping information, and the amount of information stored in the storage device can be reduced.
また、更新情報比較部は、更新情報データ取得部によって取得された各更新情報データの更新情報と、格納済み更新情報データの更新情報と比較し、更新情報が一致しない場合、更新情報データを更新情報格納部に追加するようにしてもよい。これにより、更新日時が異なっていても更新内容が同一の情報が重複して蓄積されることを防止することができる。 The update information comparison unit compares the update information of each update information data acquired by the update information data acquisition unit with the update information of the stored update information data, and updates the update information data if the update information does not match. You may make it add to an information storage part. As a result, it is possible to prevent information having the same update contents from being accumulated repeatedly even if the update date and time are different.
また、更新情報比較部は、更新情報が一致しない場合に、比較対象となる2つの更新情報の差分に対して形態素解析を行って自立語が抽出された場合、更新情報データを更新情報格納部に追加するようにしてもよい。これにより、実質的なデータの内容が更新されたものだけを更新情報として蓄積することが可能となり、データの実質的な内容とは関係のない記載の訂正等に関する更新情報が蓄積されるのを避けることができる。 In addition, when the update information does not match, the update information comparison unit performs update of the update information data when the independent word is extracted by performing morphological analysis on the difference between the two update information to be compared. You may make it add to. As a result, it is possible to accumulate only updated data contents as update information, and update information related to correction of descriptions that are not related to the substantial contents of data is accumulated. Can be avoided.
また、更新情報格納部は、更新日時が新しい順に更新情報データをソートして格納するようにしてもよい。これにより、新しい更新情報データを追加したり、古い更新情報データを削除したりする場合に、更新日時をキーとしてデータを操作することが容易になる。 The update information storage unit may sort and store the update information data in the order of update date and time. Thus, when new update information data is added or old update information data is deleted, it becomes easy to manipulate the data using the update date and time as a key.
また、更新情報更新部は、格納済み更新情報データの数が所定の閾値を超える場合、更新日時が古い順に、閾値を超える数の格納済み更新情報データを更新情報格納部から削除するようにしてもよい。これにより、蓄積された更新情報を適宜削除されるため、更新情報の格納領域の容量を一定以下に保つことができる。また、必要以上に古い情報が長期間蓄積されるのを回避することができる。 Further, when the number of stored update information data exceeds a predetermined threshold, the update information update unit deletes the number of stored update information data exceeding the threshold from the update information storage unit in order of update date and time. Also good. As a result, the accumulated update information is appropriately deleted, so that the capacity of the update information storage area can be kept below a certain level. In addition, it is possible to avoid storing information that is older than necessary for a long time.
また、閾値は、Webサーバからの1回の応答により取得される更新情報データの数と、更新情報データの最大応答揺らぎ幅との和であってもよい。また、最大応答揺らぎ幅は、Webサーバが応答する更新情報データの応答開始位置と、前回応答された更新情報データの応答開始位置との差の最大値であってもよい。これにより、Webサーバから応答される更新情報に応じて、蓄積する更新情報の量をコントロールすることが可能となり、必要な情報だけを効果的に蓄積することができるようになる。 The threshold value may be the sum of the number of update information data acquired by one response from the Web server and the maximum response fluctuation width of the update information data. The maximum response fluctuation width may be the maximum value of the difference between the response start position of the update information data to which the Web server responds and the response start position of the update information data that was previously responded. As a result, the amount of update information to be stored can be controlled according to the update information returned from the Web server, and only necessary information can be effectively stored.
また、閾値は、更新情報データの取得元であるWebサーバ毎に設定されてもよい。これにより、各Webサーバに対応して、蓄積する更新情報の量をコントロールすることが可能となる。 Further, the threshold value may be set for each Web server from which update information data is acquired. Thereby, it is possible to control the amount of update information to be stored corresponding to each Web server.
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを上述したような更新情報通知装置として機能させるための更新情報通知プログラムが提供される。 In order to solve the above problem, according to another aspect of the present invention, an update information notification program for causing a computer to function as the update information notification device as described above is provided.
以上説明したように本発明によれば、WebサーバからのRSSデータの応答に揺らぎがある場合であっても、更新された情報だけをクライアントに応答し、かつ必要な情報を効率的に蓄積することが可能となる。 As described above, according to the present invention, even if there is a fluctuation in the response of RSS data from the Web server, only the updated information is responded to the client and necessary information is efficiently stored. It becomes possible.
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.
まず、図1を参照して、本発明の一実施形態にかかる更新情報通知装置について説明する。図1は、本実施形態にかかる更新情報通知装置100の概略構成を示すブロック図である。
First, an update information notification apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram illustrating a schematic configuration of an update
本実施形態にかかる更新情報通知装置100は、図1に示すように、Webサイトの更新情報であるRSSデータを提供するWebサーバ120と、利用者が使用するクライアントコンピュータ130(以下、クライアント130)とにネットワーク110を介して接続される。本実施形態にかかる更新情報通知装置100は、Webサーバ120の代理サーバとして動作し、クライアント130からのWebデータ取得要求を受けてWebサーバ120から取得したWebサイトの更新情報をクライアント130に通知する。これによって、クライアント130とWebサーバ120間のトラフィックを低減するとともに、Webサーバ120からの応答に揺らぎがあっても、更新された情報だけを的確にクライアント130に応答することを特徴とする。
As shown in FIG. 1, an update
Webサーバ120は、HTML文書や画像などからなるWebデータを記憶領域に蓄積し、クライアント130等の要求に応じて、それらのWebデータをネットワーク110を通じて送信する。また、Webサーバ120は、Webデータの更新情報が記述されたRSSデータを蓄積し、更新情報通知装置100やクライアント130等の要求に応じて、RSSデータを送信する。Webサーバ120から送信されるRSSデータは、例えば、図4に示すRSSデータ400のようなデータであって、Webサイト内の各リソース(記事、文書など)の更新情報を示す複数のitemを含む。さらに、各itemには、リソースの更新日時を示す<date>、リソースのタイトルを示す<title>、及びリソースの要約や概要説明を示す<description>等の項目が含まれる。ここで、各itemは、更新日時を示す<date>等の情報と、更新内容を示す<title>や<description>等の情報とを少なくとも含むものとする。
The
また、Webサーバ120は、RSSデータを更新情報通知装置100やクライアント130等に対して送信する場合に、RSSデータに揺らぎを与えるように応答を制御する。ここで、RSSデータの応答の揺らぎとは、Webサーバ120が1回の応答につき10件の更新情報を応答する場合に、常に最新の10件の更新情報を応答するのではなく、2番目から11番目までの10件や3番目から12番目までの10件といったように、クライアント130等からのアクセスのタイミングによって応答する更新情報を変えるというものである。
In addition, when transmitting the RSS data to the update
本実施形態にかかる更新情報通知装置100は、図1に示すように、更新情報データ取得部101と、更新情報データ分割部102と、更新情報格納部103と、更新情報比較部104と、更新情報更新部105と、更新情報送信部106とにより構成される。また、更新情報通知装置100は、更新情報データ取得部101及び更新情報送信部106を通じてネットワーク110に接続される。以下、更新情報通知装置100の各部について説明する。
As shown in FIG. 1, the update
(更新情報データ取得部101)
更新情報データ取得部101は、クライアントにより指定されたWebサーバから、更新情報データであるRSSデータを定期的に取得するための機能部である。更新情報データ取得部101は、クライアント130により指定されたWebサーバ120に対し、RSSデータを要求し、Webサーバ120から応答されたRSSデータを取得して更新情報データ分割部102に渡す。更新情報データ取得部101は、定期的にRSSデータをWebサーバ120に対して要求するようにしてもよく、あるいは、クライアント130からの要求タイミングに合わせて行ってもよい。
(Update information data acquisition unit 101)
The update information
(更新情報データ分割部102)
更新情報データ分割部102は、取得したRSSデータをitem単位に分割するための機能部である。更新情報データ分割部102は、更新情報データ取得部101からRSSデータを受け取り、<item></item>タグに基づいてRSSデータから各itemを取り出し、分割されたデータを生成する。分割された各itemデータは、更新情報比較部104に渡される。
(Update information data division unit 102)
The update information
(更新情報格納部103)
更新情報格納部103は、取得したRSSデータを格納するための記憶部である。更新情報格納部103は、取得したRSSデータに含まれるitemのうち、更新情報比較部104によって選択されたitemのデータを受け取り、前回の取得時までに格納されたデータとマージして格納する。また、更新情報格納部103は、各itemを更新日時が新しい順にソートして格納する。
(Update information storage unit 103)
The update
(更新情報比較部104)
更新情報比較部104は、更新情報データ分割部102によって分割された各itemのデータを、更新情報格納部103に格納されたitemデータと比較し、更新情報格納部103に追加するか否かを判断するための機能部である。更新情報比較部104は、取得された各itemが、更新情報格納部103に格納済みのどのitemとも一致しない場合に、そのitemが更新されたitemと判断する。また、比較処理後、更新情報比較部104は、更新されたと判断したitemを更新情報更新部105に渡す。
(Update information comparison unit 104)
The update
例えば、各itemに、<date>、<title>及び<description>の3つの要素が含まれる場合、<title>または<description>のいずれかの値が異なる場合に、そのitemが更新されたitemであると判断するようにしてもよい。また、<date>の値だけが異なっていて、<title>及び<description>の値がいずれも同一である場合は、そのitemは更新されていないと判断するようにしてもよい。あるいは、各itemに含まれる<date>、<title>及び<description>以外の要素を含め、上記と同様の比較を行って、itemの更新有無を判断してもよい。 For example, if each item contains three elements <date>, <title>, and <description>, the item that has been updated when the value of either <title> or <description> is different You may make it judge that it is. If only the value of <date> is different and the values of <title> and <description> are the same, it may be determined that the item has not been updated. Alternatively, whether or not the item is updated may be determined by performing the same comparison as described above including elements other than <date>, <title>, and <description> included in each item.
また、<title>、<description>の値の比較において、取得したデータと格納済みデータとの間で文字列が完全に一致しない場合に、そのitemが更新されたと判断してもよく、あるいは、両者の差分として抽出された文字列に対して形態素解析を行い、意味のある文字列が取得された場合に、そのitemが更新されたと判断してもよい。ここで、意味のある文字列とは、予め定められた基準によって判断されるものであって、例えば、名詞、動詞等の自立語であってもよく、予め指定された語のいずれかであってもよい。 Also, in the comparison of the values of <title> and <description>, if the character string does not completely match between the acquired data and the stored data, it may be determined that the item has been updated, or A morphological analysis is performed on the character string extracted as the difference between the two, and when a meaningful character string is acquired, it may be determined that the item has been updated. Here, the meaningful character string is determined based on a predetermined standard, and may be, for example, an independent word such as a noun or a verb, or any of the words designated in advance. May be.
(更新情報更新部105)
更新情報更新部105は、更新情報比較部104により更新情報格納部103に追加すると判断されたitemを更新情報格納部103に格納するための機能部である。また、更新情報更新部105は、既に格納されたitemのうち、更新日時の古いitemを、Webサーバの応答の揺らぎに応じて削除する。更新情報更新部105は、格納済みitemの数が所定の閾値を超える場合に、itemの更新日時、即ち<date>の値が古い順に、閾値を超える数のitemを更新情報格納部103から削除する。
(Update information update unit 105)
The update
ここで、格納済みのitemを削除するか否かを決定するための閾値は、各Webサーバから応答されるRSSデータを観測し、各Webサーバ毎に決定するようにしてもよい。例えば、あるWebサーバが1回あたりに応答するitemの個数をNとすると、閾値は、Nに、Webサーバからの応答の揺らぎ幅の最大値である最大応答揺らぎ幅ΔNを加えた値(N+ΔN)に設定されてもよい。 Here, the threshold for determining whether or not to delete a stored item may be determined for each Web server by observing RSS data returned from each Web server. For example, if the number of items that a certain Web server responds to once is N, the threshold is a value obtained by adding a maximum response fluctuation width ΔN that is the maximum value of the fluctuation width of the response from the Web server (N + ΔN). ) May be set.
ここで、Webサーバからの応答揺らぎ幅とは、各応答時においてWebサーバから応答されるRSSデータの開始位置と、前回応答時においてWebサーバから応答されたRSSデータの開始位置との差をいう。ここで、あるWebサーバが、10件のitemを含むRSSデータを有しており、1回の応答時に5件のitemを含むRSSデータを応答する場合の例を、図2に基づいて説明する。図2は、本実施形態にかかるRSSデータをクライアント側で蓄積するための方法を示す説明図である。 Here, the response fluctuation width from the Web server refers to the difference between the start position of the RSS data responded from the Web server at each response and the start position of the RSS data responded from the Web server at the previous response. . Here, an example in which a certain Web server has RSS data including 10 items and responds with RSS data including 5 items at one response will be described with reference to FIG. . FIG. 2 is an explanatory diagram illustrating a method for accumulating RSS data according to the present embodiment on the client side.
まず、最初に更新情報格納部103には4件のitem2〜5までを含むRSSデータ201が格納されているものとする。以降、Webサーバ120に対し、計4回にわたりRSSデータを要求した場合の例を説明する。まず、1回目のデータ取得時において、Webサーバ120からitem3〜7までを含むRSSデータ202が応答される。ここで、更新情報比較部104によってRSSデータ201とRSSデータ202とが比較され、差分であるitem6及び7をRSSデータ201に追加したRSSデータ203が更新情報格納部103に格納される。
First, it is assumed that
次いで、2回目のデータ取得時において、Webサーバ120からitem1〜5までを含むRSSデータ204が応答される。ここで、更新情報比較部104によってRSSデータ203とRSSデータ204とが比較され、差分であるitem1をRSSデータ203に追加したRSSデータ205が更新情報格納部103に格納される。ここで、前回取得時のRSSデータ202と、RSSデータ204とのitemの開始位置を比較してみると、RSSデータ202のitem開始位置は3、RSSデータ202のitem開始位置は1であることから、その差は2であることが分かる。これが、RSSデータの応答の揺らぎ幅であり、この値の最大値をRSSデータ取得毎に算出することにより、上述の閾値(N+ΔN)を設定することができる。
Next, at the time of data acquisition for the second time,
図2の例では、ΔN=2であるため、閾値をN+ΔNと設定した場合、閾値は5+2=7となる。2回目のRSSデータ取得時では、更新情報格納部103に格納されているitem数は7個であるため、まだitemを削除する必要がないと判断される。
In the example of FIG. 2, since ΔN = 2, when the threshold is set as N + ΔN, the threshold is 5 + 2 = 7. When the RSS data is acquired for the second time, the number of items stored in the update
3回目のデータ取得時には、item2〜5までを含むRSSデータ206がWebサーバ120から応答される。ここで、RSSデータ205とRSSデータ206とを比較すると、新規に追加されるitemはないため、格納されるRSSデータは205のままとなる。また、最大応答揺らぎ幅も、前回データ取得時のΔN=2のままとなる。
At the time of data acquisition for the third time,
次に、4回目のデータ取得時に、Webサーバ120からitem4〜8までを含むRSSデータ207が応答される。RSSデータ205とRSSデータ207とを比較して、RSSデータ205にitem8を追加したRSSデータ208が更新情報格納部103に格納される。ここで、更新情報格納部103に格納されるitem数が閾値=7を超えるため、更新情報更新部105は、閾値を超える数(8−7=1個)のitemを更新情報格納部103から削除すると判断する。従って、更新情報更新部105は、最も更新日時の古いitem1を更新情報格納部103から削除する。
Next, the
(更新情報送信部106)
更新情報送信部106は、更新情報更新部105によって更新情報格納部103に追加された更新情報データであるitemからなる更新情報通知データを生成し、クライアント130に送信するための機能部である。更新情報送信部106は、更新情報更新部105から更新情報格納部103に格納されたのと同じitemのデータを受け取り、それらitemが記述されたRSSデータを生成する。生成したRSSデータは、クライアント130にネットワーク110を経由して送信される。
(Update information transmission unit 106)
The update
以上、更新情報通知装置の構成について説明した。なお、更新情報データ取得部101、更新情報データ分割部102、更新情報比較部104、更新情報更新部105及び更新情報送信部106の各部は、上述した各機能を実行可能なプログラムモジュールをコンピュータ等の情報処理装置にインストールしたソフトウェアで構成されてもよいし、あるいは、上述した各機能を実行可能なプロセッサ等のハードウエアで構成されてもよい。また、更新情報格納部103は、例えば、半導体メモリ、光ディスク、磁気ディスク等の各種の記憶媒体等により構成されてもよい。
The configuration of the update information notification device has been described above. The update information
次に、図3に基づいて、本実施形態にかかる更新情報通知装置100により実行される更新情報通知処理の一例を説明する。ここで、図3は、本実施形態にかかる更新情報通知装置100により実行される更新情報通知処理の流れを示すフローチャートである。
Next, an example of the update information notification process executed by the update
まず、ステップS300において、更新情報データ取得部101が、クライアント130によって指定されたURLのWebサーバ120にアクセスし、RSSデータを取得する。なお、ステップS300のWebサーバへのアクセスは、定期的に行われるようにしてもよく、クライアント130からの要求タイミングに合わせて行うようにしてもよい。取得されたRSSデータは、更新情報データ取得部101から更新情報データ分割部102に渡される。ステップS300以降のステップS302〜S316の処理は、RSSデータを取得する毎に実行される。
First, in step S300, the update information
次いで、ステップS302で、更新情報データ分割部102が、取得されたRSSデータを、item単位に分割する。分割されたitem単位のRSSデータは、更新情報データ分割部102から更新情報比較部104に渡される。
Next, in step S302, the update information
次いで、ステップS304で、更新情報比較部104が、更新情報格納部103に格納されているRSSデータと、取得したRSSデータとをitem単位で比較する。以下、ステップS306〜S314の処理を、取得したRSSデータの各itemに対して実行する。
Next, in step S304, the update
まず、ステップS306で、更新情報比較部104が、取得したitemの<title>の値と、格納されている各itemの<title>の値とを比較する。取得したitemの<title>の値が、格納されているどのitemの<title>とも異なれば、更新されたitemであると判断し、ステップS310に遷移する。
First, in step S306, the update
一方、ステップS306の比較において、<title>の値が同じitemがあれば、ステップS308に遷移する。ステップS308で、更新情報比較部104が、<title>の値が同じitemの<description>の値と、取得したitemの<description>の値とを比較する。ここで、<description>の値が、どのitemとも異なれば、更新されたitemであると判断し、ステップS310に遷移する。
On the other hand, if there is an item having the same value of <title> in the comparison in step S306, the process proceeds to step S308. In step S308, the update
ステップS308で比較した結果、<description>の値も同じであれば、更新されていないitemと判断し、ステップS314に遷移する。 If the value of <description> is the same as a result of the comparison in step S308, it is determined that the item has not been updated, and the process proceeds to step S314.
なお、ステップS306及びS308の比較処理において、取得したデータと格納済みデータとの間で文字列が完全に一致しない場合に、そのitemが更新されたと判断してもよく、あるいは、両者の差分として抽出された文字列に対して形態素解析を行い、意味のある文字列が取得された場合に、そのitemが更新されたと判断してもよい。ここで、意味のある文字列とは、予め定められた基準によって判断されるものであって、例えば、名詞、動詞等の自立語であるか否かによって判断されてもよく、予め指定された語のいずれかに該当するか否かによって判断されてもよい。 In the comparison processing in steps S306 and S308, when the character string does not completely match between the acquired data and the stored data, it may be determined that the item has been updated, or as the difference between the two A morphological analysis is performed on the extracted character string, and when a meaningful character string is acquired, it may be determined that the item has been updated. Here, the meaningful character string is determined based on a predetermined criterion, and may be determined based on whether it is an independent word such as a noun, a verb, or the like. Judgment may be made based on whether or not one of the words is applicable.
また、本実施形態においては、各itemの<title>または<description>のいずれかの値が異なる場合に、そのitemが更新されたitemであると判断するようにしたが、これ以外の判断基準を用いてもよい。例えば、<date>の値を比較することによりitemの更新有無を判断してもよく、あるいは、<date>、<title>及び<description>以外の要素を含め、上記と同様の比較を行って判断してもよい。 In this embodiment, when any item <title> or <description> has a different value, it is determined that the item is an updated item. May be used. For example, it may be determined whether the item is updated by comparing the values of <date>, or the same comparison as above is performed, including elements other than <date>, <title>, and <description>. You may judge.
一方、ステップS306及びS308の比較処理の結果、取得したitemが更新されたitemであると判断された場合、そのitemは、更新情報比較部104から更新情報更新部105に渡される。その後、ステップS310で、更新情報更新部105は、更新情報格納部103に格納されているitemの<date>の値を比較して、更新されたitemを新しい日付順に並べて更新情報格納部103に格納する。また、更新情報更新部105は、更新されたitemを更新情報送信部106に渡す。
On the other hand, when it is determined that the acquired item is an updated item as a result of the comparison processing in steps S <b> 306 and S <b> 308, the item is transferred from the update
次いで、ステップS312で、更新情報更新部105は更新情報格納部103に格納されているitem数をチェックし、item数が予め定める閾値以上の場合は、<date>の値が最も古いitemから順に削除する。
Next, in step S312, the update
ここで、格納済みのitemを削除するか否かを決定するための閾値は、各Webサーバから応答されるRSSデータを観測し、各Webサーバ毎に決定するようにしてもよい。例えば、あるWebサーバが1回あたりに応答するitemの個数をNとすると、閾値は、Nに、Webサーバからの応答の揺らぎ幅の最大値であるΔNを加えた値(N+ΔN)に設定されてもよい。 Here, the threshold for determining whether or not to delete a stored item may be determined for each Web server by observing RSS data returned from each Web server. For example, if the number of items that a certain web server responds to once is N, the threshold is set to a value (N + ΔN) obtained by adding ΔN that is the maximum value of the fluctuation width of the response from the web server to N. May be.
ステップS314で、取得したRSSデータに含まれる全てのitemの比較処理が終了したかを判断し、終了していない場合はステップS304に戻り、ステップS304〜S314の処理を繰り返す。全てのitemの比較処理が終了した場合、ステップS316に遷移する。 In step S314, it is determined whether or not all items included in the acquired RSS data have been compared. If not, the process returns to step S304, and steps S304 to S314 are repeated. When the comparison processing for all items is completed, the process proceeds to step S316.
ステップS316で、更新情報送信部106は、更新されたitemとして更新情報格納部103に新たに追加されたitemからRSSデータを生成し、更新情報としてクライアント130に送信する。更新されたitemが存在しない場合は、何もデータを送信しないようにしてもよく、または、更新が無いことを通知するようにしてもよい。
In step S316, the update
以上、更新情報通知装置100により実行される更新情報通知処理について説明した。
The update information notification process executed by the update
かかる構成により、WebサーバからのRSSデータの応答に揺らぎがある場合であっても、本当に更新(追加)された情報のみを利用者に対して通知することが可能になる。また、更新情報を蓄積する場合に、重複する情報を蓄積することなく、必要な情報を効果的に蓄積することができ、記憶装置に蓄積される情報量を削減することが可能となる。 With this configuration, even if there is a fluctuation in the response of the RSS data from the Web server, it is possible to notify the user of only the information that has been really updated (added). Further, when updating information is stored, necessary information can be stored effectively without storing overlapping information, and the amount of information stored in the storage device can be reduced.
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to the example which concerns. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
100 更新情報通知装置
101 更新情報データ取得部
102 更新情報データ分割部
103 更新情報格納部
104 更新情報比較部
105 更新情報更新部
106 更新情報送信部
110 ネットワーク
120 Webサーバ
130 クライアントコンピュータ(クライアント)
DESCRIPTION OF
Claims (8)
指定されたWebサーバから、Webデータの更新内容を示す更新情報と更新日時とを少なくとも含む更新情報データを定期的に取得する更新情報データ取得部と、
過去に取得された前記更新情報データを格納する更新情報格納部と、
前記更新情報データ取得部によって取得された前記各更新情報データを、前記更新情報格納部に格納された格納済み更新情報データと比較し、前記更新情報格納部に追加するか否かを判断する更新情報比較部と、
前記更新情報比較部により前記更新情報格納部に追加すると判断された前記更新情報データを前記更新情報格納部に格納する更新情報更新部と、
前記更新情報更新部によって前記更新情報格納部に追加された前記更新情報データを用いて更新情報通知データを生成し、クライアントコンピュータに送信する更新情報通知データ送信部と、
を備えることを特徴とする、更新情報通知装置。 In an update information notification device for notifying update information of Web data acquired from a Web server in response to a Web data acquisition request from a client computer,
An update information data acquisition unit that periodically acquires update information data including at least update information indicating update contents of the Web data and update date and time from a specified Web server;
An update information storage unit for storing the update information data acquired in the past;
An update for comparing each update information data acquired by the update information data acquisition unit with stored update information data stored in the update information storage unit and determining whether to add to the update information storage unit An information comparison unit;
An update information update unit for storing in the update information storage unit the update information data determined to be added to the update information storage unit by the update information comparison unit;
An update information notification data transmission unit that generates update information notification data using the update information data added to the update information storage unit by the update information update unit, and transmits the update information notification data to a client computer;
An update information notification device comprising:
前記最大応答揺らぎ幅は、前記Webサーバが応答する前記更新情報データの応答開始位置と、前回応答された前記更新情報データの応答開始位置との差の最大値であることを特徴とする、請求項5に記載の更新情報通知装置。 The threshold is a sum of the number of the update information data acquired by one response from the Web server and the maximum response fluctuation width of the update information data,
The maximum response fluctuation width is a maximum value of a difference between a response start position of the update information data to which the Web server responds and a response start position of the update information data responded last time. Item 6. The update information notification device according to Item 5.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006343520A JP2008158589A (en) | 2006-12-20 | 2006-12-20 | Updated information notification device, and updated information notification program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006343520A JP2008158589A (en) | 2006-12-20 | 2006-12-20 | Updated information notification device, and updated information notification program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2008158589A true JP2008158589A (en) | 2008-07-10 |
Family
ID=39659462
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006343520A Pending JP2008158589A (en) | 2006-12-20 | 2006-12-20 | Updated information notification device, and updated information notification program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2008158589A (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010211708A (en) * | 2009-03-12 | 2010-09-24 | Brother Ind Ltd | Communication apparatus and program |
| JP2011180647A (en) * | 2010-02-26 | 2011-09-15 | Yahoo Japan Corp | Information display device, information display method, and server |
| JP2012009024A (en) * | 2010-06-24 | 2012-01-12 | Nhn Corp | Document collection system and method |
| JP2012133419A (en) * | 2010-12-20 | 2012-07-12 | Jvc Kenwood Corp | Voice file recording apparatus, voice file reproducing apparatus, voice file recording and reproducing system, voice file recording method, voice file reproducing method and computer program |
| US8291013B2 (en) | 2009-03-12 | 2012-10-16 | Brother Kogyo Kabushiki Kaisha | Communication apparatus and storage medium storing program |
| JP2013535068A (en) * | 2010-06-28 | 2013-09-09 | ナブテック ビー.ヴイ. | Method and apparatus for paged update protocol |
| JP2018152833A (en) * | 2017-03-14 | 2018-09-27 | 株式会社リコー | Information processing device, merge method, and program |
| JP2021189682A (en) * | 2020-05-28 | 2021-12-13 | クラウドカンパニー株式会社 | Program, information processing method, and information processing device |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1049553A (en) * | 1996-08-05 | 1998-02-20 | Toshiba Corp | Information collection method |
| JP2003256316A (en) * | 2002-02-26 | 2003-09-12 | Mitsubishi Electric Corp | Information providing apparatus, information providing system, information providing method, and program |
| JP2004227221A (en) * | 2003-01-22 | 2004-08-12 | Sharp Corp | Data management decision method, data management decision device, data management decision program, and recording medium recording data management decision program |
| JP2004295553A (en) * | 2003-03-27 | 2004-10-21 | Nippon Telegr & Teleph Corp <Ntt> | Information posting method, server, and program |
| JP2006099341A (en) * | 2004-09-29 | 2006-04-13 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Update history generation device and program |
-
2006
- 2006-12-20 JP JP2006343520A patent/JP2008158589A/en active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1049553A (en) * | 1996-08-05 | 1998-02-20 | Toshiba Corp | Information collection method |
| JP2003256316A (en) * | 2002-02-26 | 2003-09-12 | Mitsubishi Electric Corp | Information providing apparatus, information providing system, information providing method, and program |
| JP2004227221A (en) * | 2003-01-22 | 2004-08-12 | Sharp Corp | Data management decision method, data management decision device, data management decision program, and recording medium recording data management decision program |
| JP2004295553A (en) * | 2003-03-27 | 2004-10-21 | Nippon Telegr & Teleph Corp <Ntt> | Information posting method, server, and program |
| JP2006099341A (en) * | 2004-09-29 | 2006-04-13 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Update history generation device and program |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010211708A (en) * | 2009-03-12 | 2010-09-24 | Brother Ind Ltd | Communication apparatus and program |
| US8291013B2 (en) | 2009-03-12 | 2012-10-16 | Brother Kogyo Kabushiki Kaisha | Communication apparatus and storage medium storing program |
| JP2011180647A (en) * | 2010-02-26 | 2011-09-15 | Yahoo Japan Corp | Information display device, information display method, and server |
| JP2012009024A (en) * | 2010-06-24 | 2012-01-12 | Nhn Corp | Document collection system and method |
| JP2013535068A (en) * | 2010-06-28 | 2013-09-09 | ナブテック ビー.ヴイ. | Method and apparatus for paged update protocol |
| US9792381B2 (en) | 2010-06-28 | 2017-10-17 | Here Global B.V. | Method and apparatus for a paged update protocol |
| JP2012133419A (en) * | 2010-12-20 | 2012-07-12 | Jvc Kenwood Corp | Voice file recording apparatus, voice file reproducing apparatus, voice file recording and reproducing system, voice file recording method, voice file reproducing method and computer program |
| JP2018152833A (en) * | 2017-03-14 | 2018-09-27 | 株式会社リコー | Information processing device, merge method, and program |
| JP2021189682A (en) * | 2020-05-28 | 2021-12-13 | クラウドカンパニー株式会社 | Program, information processing method, and information processing device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8745075B2 (en) | Notification method for a dynamic document system | |
| US10067920B2 (en) | Identifying changes for online documents | |
| US8725719B2 (en) | Managing web page links using structured data | |
| US9767082B2 (en) | Method and system of retrieving ajax web page content | |
| US7873632B2 (en) | Systems and methods for associating a keyword with a user interface area | |
| US8762556B2 (en) | Displaying content on a mobile device | |
| US20150363504A1 (en) | Dynamically identifying and evaluating component hierarchy for rendering content components on a webpage | |
| US8584009B2 (en) | Automatically propagating changes in document access rights for subordinate document components to superordinate document components | |
| US9454535B2 (en) | Topical mapping | |
| WO2007063547A2 (en) | System and method for appending security information to search engine results | |
| US9170988B2 (en) | Method for causing computer to display page view on display area by converting HTML page into new HTML pages, and non-transitory computer readable media recording program | |
| KR101496327B1 (en) | Application execution method and apparatus | |
| JP2008158589A (en) | Updated information notification device, and updated information notification program | |
| US9524351B2 (en) | Requesting, responding and parsing | |
| JP2008204189A (en) | Updated information responding device and web server | |
| US20100023888A1 (en) | Method and apparatus for controlling focus of application | |
| US20090132493A1 (en) | Method for retrieving and editing HTML documents | |
| JP2006185167A (en) | File search method, file search device, and file search program | |
| CN117520678A (en) | Webpage processing method and device, electronic equipment and storage medium | |
| JP4253315B2 (en) | Knowledge information collecting system and knowledge information collecting method | |
| JP5089091B2 (en) | Content collection system | |
| JP3725087B2 (en) | Knowledge information collecting system and knowledge information collecting method | |
| KR100705412B1 (en) | Web Server-based Desktop Search System and Method for Supporting RSS Search | |
| JP2004362241A (en) | Document update content data creation device, document update content data creation method, and control program for document update content data creation device | |
| JP3725836B2 (en) | Knowledge information collecting system and knowledge information collecting method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090120 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110713 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111213 |