バナー 老科学者の繰り言 論理と科学を語る

トップ 数値の表現 科学と論理 科学の周辺 番 外 プロフィール




インパクトファクター

最近、自然科学関係の発表論文の「質」の評価に、インパクトファクターがよく使われるようになった。インパクトファクターとは何であろうか。
このページはwww.nch.go.jp/genetics/で1995年頃から私の退職時2009年まで(さらにはその後の期間)掲載していたページの復刻版である。

インパクトファクターの概略 については 前ページを参照ください。

IF値の傾向と対策

レビュー誌=総説は高いIF値を示す傾向がある

レビュー誌は高いIF値を示す傾向があると言われている。実際(1996年に発行された)IF95によるとインパクトファクター値が10を越えた雑誌は48誌あるが、 この半数以上 (25) がレビュー雑誌である。
レビュー雑誌はその性質上、少数の論文が掲載され、各論文は多数(時には数百におよぶ)の論文を引用している。最近の専門雑誌では印刷スペースを節約しようとして 引用論文数を制限する傾向がある。そのようなときに、根拠となった原著論文を丹念に引用しようとすると引用論文数が増えるため、それら原著論文を網羅的に引用している レビュー論文1つを引用することで一括代用しようとする傾向がある。投稿しようとする専門雑誌が引用論文数を制限していなくても、 投稿者の怠惰(本当は原著論文を読んでいなかったり、あるいはいちいち引用を確認する手間を省略)から、レビュー誌を引用する傾向があることもこの現象に拍車をかけている。
ただ注意したいのは、IF値が高いレビュー誌はAnnual Review社が出版しているANNU REV * 各誌や、Elsevier Science社のTRENDS in *をはじめ、 各分野での(伝統かつ権威ある)代表的な雑誌であり、レビュー誌でもIFが低いのは当然存在する。その点で、以下に述べる「少数雑誌への集中」とも言える。

IF値の原理は雑誌当たりの (引用された数)/(発表論文数)であるが、(引用された数)-(引用した論文数)というパラメーターも考えうる。 この値は、論文作成に当たって根拠となりまた有用であった従来の研究成果に対し、発表後に当該論文が果たした役割との差とも考えられ、「付加価値」パラメーターといえる。 ISI社によれば1981-1985年に発表された論文の55%は1985-1990年に一度も引用されなかったというから圧倒的多数の論文は(当然引用しているから)付加価値が負といえる。 レビュー誌に掲載された論文は多数の引用を伴っているので、その付加価値パラメーターを基にすればインパクトファクター値ほどの評価を受けないであろう。 しかし、論文作成に当たり、根拠となりまた有用であった従来の研究成果を全て引用しているとは限らず、またこのようなパラメーターの提唱によって、 自分の発表論文の付加価値を高めるために、あえて引用論文数を制限する(過少申告)ことになれば、このパラメーターの意味は無くなるであろう。

少数への集中

自然科学の分野でNatureとScienceがもっとも権威ある雑誌の双璧であるとの考えは多くの研究者の賛同が得られるであろう。歴史が長く、週刊である点で共通し、 それぞれ英国と米国を基盤とする点でライバルであった。Multi-disciplinary と称しながら、実際には生物学(そして医学)関係の論文が多いのは、今日の学問の隆盛と 各分野での論文発表形態によるものと考えられる。臨床ではNew England J MedicineとLancetとが該当しようか。

NatureとScienceのインパクトファクターの推移は次のようである。
年 Nature Science

IF96 28.417 23.605
IF95 27.074 21.911 
IF94 25.466 22.568
IF93 22.326 21.074
IF93 22.139 20.967
IF92 19.337 19.607
IF91 19.092 19.643
IF90 18.063 18.258
IF89 15.758 16.458
IF88 14.999 14.304
IF87 15.252 12.437
IF86 12.863 10.900

IF81 7.187 6.237
IF80 6.237 5.708
再掲載時の補:なお、手持ちの資料2007JRRまでで、Nature, Scienceが最高値を付けたのは2004年で、それぞれ32.182 と 31.853であった。 ピークを付けた原因については別稿で考察する。

NatureはIF89からIF92の間Scienceに先んじられたが、その後巻き返し、近年差を開きつつあることは、Nature誌自身が広告でアピールしているので 知っている人も多いだろう。ところがもう1つ注目すべき点は、1980年頃はともに5~7程度であったということだ。5~7というのは今日では専門一流紙というレベルである。 専門一流誌のIF値推移はそれぞれの雑誌の事情によって違うが、トップの位置を保っている雑誌でも、80年頃から若干の増加傾向が見られるに止まっている雑誌が多い。 すなわち、80年当時は専門一流誌も5程度であり、実際、IF95でもNatureやScienceを上回っているCELLはともかく、J EXP MED、J CELL BIOL、 CIRCULATION、J CLIN INVESTがSCIENCEのIF値を上回っていた。
このことは、頻繁に引用される雑誌(本当はそこに掲載されている論文)がますます頻繁に引用される傾向が、最近とみに増していることを表している。 どうしてであろうか。最近研究に関する情報は著しく増加し、刊行される専門誌の数も増えている。中には競争に負け、あるいは経営がうまく行かず廃刊に 追い込まれる専門雑誌も無くはないが、原著論文を発表する場所が増えれば原著論文の数も増えるという循環にある。そういう状況で各研究者は 自分の領域すらフォローすることが困難となり、徹底的に検索するには二次抄録などを活用する一方で、日常的には研究動向を知るために、 ニュース性の高い雑誌や、分野をリードする専門雑誌のみを購読する傾向が強くなってきたことによると考える。集中はさらに集中を呼び、今後もこの傾向が続くであろう。

インパクトファクター値の揺らぎ

IF95で最高値を示したのはCLIN RESで58.286であった。この雑誌はIF88まで0.1程度を推移していたのに、IF89以降突然のごとく37~66の高値を示しているので、 その不自然さは容易に気づかれる。この雑誌は、主として抄録や学会プログラムを掲載し、一部に著名な研究者の論文を加えている。ISI社による分類では前者群をsourceとして 計算していなく、すなわちインパクトファクター計算における分母として計算していないのに対し、引用される対象(分子にあたる)としては前者も後者も同等に扱っているからだ。 このように、sourceとしてはSCI社の一定のチェックがあるが、被引用はまったくチェックされていない。したがってある論文の著者が(巻や頁に)誤った引用をしている場合、 そのままである。極端な場合、雑誌の名前を間違えて引用しても、JCRのデータベースにはそのまま登録されてしまう。発表論文の引用に語記の多いことは、 既に識者が何度も指摘していることである。同様な現象は他の雑誌でも、これほど極端ではないが生じている。私の研究分野に関係する人類遺伝学分野の雑誌で見てみよう。 遺伝病の責任遺伝子など、最近はDNA研究が盛んで、最近に生まれたNAT GENETやHUM MOL GENETは高値を示すが、それらは別として、 以前から出版されている古典的な5誌を比べてみる。
               IF94 IF90 IF85
AM J HUM GENET       8.598 6.521 4.234
HUM GENET         2.758 2.861 2.593
CYTOGENET CELL GENET   2.533 4.482 5.799
J MED GENET         2.865 1.343 1.411
AM J MED GENET       1.645 1.582 1.513
ここでは特定の年の値しか示していない。米国人類遺伝学会の学会誌であるAM J HUM GENETはDNA研究者の学会加盟による著しい拡大にあわせ、 掲載論文もいち早くDNA分野へ転換することに成功し、IF値も高値へ移行してきた。それ以前、主として臨床報告と染色体レベルの異常解析を主としていた時代でも、 内容的にはAM J HUM GENETがこの分野のトップジャーナルであるという認識を私は持っていたが、IF値ではCYTOGENET CELL GENETと並ぶか、逆に下回っていた年が多い。 CYTOGENET CELL GENETに掲載される論文の質は、HUM GENETとほとんど変わりなく、この分野の第2ないし3番目の雑誌と(私は個人的に)評価していた。 にもかかわらずCYTOGENET CELL GENETが高いIF値をキープしていたのは同誌がHuman Gene Mappingの会議議事録と結果の掲載雑誌であったからである。 ヒト遺伝子マッピングにかかわる広範領域をカバーするHuman Gene Mappingに関するミーティングは2年に1回開催され、染色体ごとに、 あるいは腫瘍関連とか疾患関連とか他生物種との関連といった分科会ごとに、その段階での最新情報がまとめられ、報告の形で公表される。 これは個人と言うより委員会としての集大成情報であり、上記(1)の権威ある総説に相当するので引用されることが多い。さらにご丁寧に、これらの報告を引用する場合、
When referring to this report as an entity in text, it should be cited as: Human Gene Mapping 11 (1991). Cytogenet. Cell Genet., 58, 1-2200 (1991). Committee reports and abstracts should be cited according to author names as usual. The complete citation for a reference list is: Authors, title of report, Human Gene Mapping 11 (1991). Cytogenet. Cell Genet., 58, (page numbers) (1991).とするように具体的に示唆されていた。ミーティング以降の短期間であれば、とにかくHuman Gene Mapping 11 (1991). Cytogenet. Cell Genet., 58, 1-2200 (1991)と引用さえしておけば、ヒト遺伝子に関するほとんどのことが引用漏れにはならないのである。他にこんな安直な方法があるのだろうか。 それに加えて、10回大会までは参加者の抄録すら掲載されていたので、これらを個別に引用する論文もあったであろうが、抄録はsourceになっていない(すなわち分母に加算されない)のである。

JPN J EXP MEDも奇妙な値を残した雑誌である(私自身、直接見たことも無い雑誌のことで、間違っていたら関係者にお詫び致します)。 この雑誌は80年以来、0.3程度の値を維持していたが、IF90=0.280、IF91=1.215、IF92=4.674となって、IF93以降は項目名としても登場していない。 しかし、日本で発行される欧文雑誌で4とはとてつもなく高い値であり、がんばったといえる。sourceを調べると、91年92年ともに0、すなわち90年をもって廃刊された雑誌と考えられる。 ある時点で廃刊になると高い値を示すのであろうか。インパクトファクターの式に基づいて考えると、一般的にはそうとは限らない。同誌の命があったときには毎年50弱のsourceがあり、 インパクトファクター値が0.3ということは1年間に30の引用を受けていたことになる。それが91年には約120回の引用を受け、92年は215回の引用を受けた。 引用されたのは1990年に発表された論文である。これは従来の同誌の経緯から見て異常な高い被引用数であり、雑誌の命を長らえようとどなたか関係者が優れた論文を掲載されたのであろうか。 もしそうなら、長らえるチャンスはあったに違いない。高度に引用された論文が、雑誌廃刊の弔辞自身でないことを祈る。

廃刊に対し、新規発行の場合はインパクトファクター式の原理から、少なくとも(カレンダー年で)2年を経過しないと値が成立しない。1995年1月に創刊されたNature Medicineは 1997年暮れに発行されたJCRで初めてインパクトファクター値が振られた(IF96)。一方、雑誌名変更の場合、アルファベット順に配置したときに配列位置がほとんど変わらない場合 (検索などで不便をかけない)、完全な継続雑誌として単一なユニットとして取り扱われているようである。併合分割の場合、たとえばINDIAN J MED RES(およびその-Aと-B)をみると、 継続であったり、時には並列であったり、一貫性が無い。SCI社の判断次第であるようだ。
業績評価などにインパクトファクター値が使用される状況では、創刊されて間もない雑誌に投稿するのはある意味でリスクを伴い、また逆にねらい目でもあり、 自分の思惑と他人の思惑との差を付ける点で、馬券を買うのに似ているといえよう。

平均値の勘違い

各値が正規分布に近いように分散している場合、平均値と言うのは真に意味がある。しかし、正規分布に従わない集団では平均値の意味を充分に把握する必要がある。 インパクトファクター値も「平均値」であるが、個々の論文が引用される回数は正規分布ではないだろう。特にインパクトファクターが高値の雑誌の場合、圧倒的数(数百)で引用される 少数の論文+平均値以下でしか引用されない多数の論文(後者の群では比較的正規分布に近いかもしれない)から構成され、一方、インパクトファクターが1以下の雑誌では、 全く引用されない論文+少数の引用される論文(ポアッソン分布?)という構成であろう。収入とか貯蓄額とかの平均値が報道されると、予想以上に大きな値に驚くが、 少数の著しい高額者が引っ張りあげているからだ。一方、引用数にマイナスはないから引っ張り下げるというようなことはない。中央値(mean)で比較したら面白いかもしれない。

Editorの思惑

インパクトファクター値が普及し、読者も雑誌講読を決定する要素となり、また投稿先雑誌を選択する基準ともされると、ますます高値の雑誌は栄え、低値の雑誌は低落するという 循環が加速する。商業誌であれば経営に直接関係し、学会誌などでも影響が大きいであろう。そのような状況から、雑誌の編集に関わる人(研究者であるか否かに関わらず) インパクトファクターを上昇させようと意識せざるを得なくなる。
多くの読者に注目される優秀な論文を掲載し(引用する研究者もいるだろう)、雑誌の評価を上げ、さらに多くの投稿論文を確保し、採択率を下げて、選別した優秀な論文を 掲載するというのはまっとうな戦術である。採択率を下げるというと我々日本人は少し違和感があるが、競争原理を基本とする米国人にとっては当然のことである。 ところが、この正統的戦術が効果を生むのには時間がかかるし、まずきっかけが必要である。そこで多くの編集者は総説に着目した。 (優秀な)総説はインパクトファクターを押し上げる要因であることは初めに記載した。特にCELLがmini reviewによって一層の成功を収めたことに多くの編集者が着目している。 CELLがmini reviewを掲載し始めた経緯がインパクトファクターまで意識したかどうかは自信がないが、しかし、多くの読者の関心を呼ぼうとして導入したことは確かである。 CELLはIF95で40以上の値を示しているが、mini reviewがどの程度貢献しているのか、SCI社は調査して欲しい。 今日、原著論文の掲載を主とする多くの専門雑誌が、少数の総説も掲載している。

次に、インパクトファクターのsourceにカウントされない記事の掲載である。原著論文と総説だけがsourceとは限らない。NATUREやLANCETではletterが主な構成要素であり、 これらは立派なsourceである。しかし、雑誌により分類や形態が異なる記事の、どれをsourceとして計算し、どれを計算しないかはやはりSCI社の独断である。 NATUREのNews & Viewsはsourceとして計数されているのだろうか(調べていなくてごめんなさい)。しかし、表紙の図版の説明、書評、商品紹介などといった記事は sourceとして計数されていないことは確信する。しかしこのような記事を引用する人も無くはないだろう。抄録や個人的な情報交換を引用することを許可しないと編集方針に 銘記している例は多いが、論文以外の引用を不可としているのではなく、たとえばNature巻頁年とそろっていれば、それが書評であるかどうかなどと内容まで照会されないのが普通である。 またSCI社でインパクトファクター計算時にはチェックなないのだから。もし自分の雑誌のcommentaryがsourceに組み入れられていなかったら、 投稿論文の一部をcommentaryに(落として)廻すのである。そうした論文も何がしかの被引用を得て、貢献することだろう。

論文を投稿したときに、reviewerから具体的な論文の引用を示唆されることがある。あくまで示唆で、脅迫ではないが、論文受理が目の前にぶら下がっている投稿者としては ほとんどがその意に従うであろう。そうした示唆の多くはreviewerから出ており、またそのreviewer自身が関係する論文であることが多い。しかし、時にはEditorから当該雑誌に 最近掲載された論文を引用するように示唆されることもある。これもストーリー展開に役立つよと好意的に受け取ればそうであるが、また自分の雑誌の宣伝効果も兼ねていることは否めない。

再掲載時の補足

nch.go.jp/genetics/ に掲載時には、1998年から2006年版のJournal Ranking Reportを受けて、 関心のある数誌のIF値と動向を補足していた。ここではIF値は省略するが、その時に記載したコメントの一部を記載する
IF2003を受けて:IF2003年版で、IF値がトップ50の雑誌について過去数年分の推移を示す。IF2002以前の値は rounddown してある。(値の表省略) 新規発刊雑誌が目立ちます。上記の50雑誌の内で、CD-ROM版が得られれいる=全データがそろっているIF1994から値が継続しているのは、わずかに28雑誌です。 IF値が上位にランクされる新規発刊雑誌にはNature系が目立ちます。一方、CellはIF1996で40.997を記録して以降、低落の傾向がみられます。出版権を移行した影響?
IF2005を受けて:上位雑誌の値、および平均値で見てもIF値は少しづつ、増加傾向があります。これは、研究活動および発表(活動)が活発化していることを反映していると考えます。 ただ、採録する雑誌はISI社次第ですので、採録範囲を(過剰に)拡大すれば、平均値が低下することもありえます(たとえば、1996年から1997年にかけて?)

nch.go.jp/genetics/ では当初(1994年)からこのインパクトファクターのページを掲載し、私のサイトで最もよく読まれたページの一つであった。インパクトファクターを広めた一人として 当初の意図などを書き残しておきたい気持ちがあり、将来追加したい。その予告ではないが、次の点をここに記しておきたい。
私が最初にSCIとかJRRを学んだのは、大学院を修了した1976年に行った国立遺伝学研究所で、木村資生先生(進化の中立説)から学んだ。1981年に留学した米国コールドスプリングハーバー研究所の 図書館にはSCIがあり、関係分のIF値などをコピーした(IF1980,1981)。帰国してからも度々CSHLを訪問する機会があったが、その度に同図書館で資料をコピーさせてもらった。 そのおかげで1985年版以降のJRR全データが手元に残り(データベースを構築していた)、また1994年版以降はCD-ROMを購入してきた。IF値に関心のあった諸先生方に、 関係雑誌のIF値を個人的にお伝えしていたことも多かった。