本発明は、乳癌に関連することが見出された多型の変異体およびハプロタイプを開示する。染色体5p12上の多型マーカーの特定の対立遺伝子は、乳癌と関連することが見出された。このようなマーカーおよびハプロタイプは、診断目的、薬剤反応の予測方法および治療進行の予測方法に対して、本願明細書にさらに詳細に記載されるように、有用である。本発明のさらなる適用は、本発明の多型マーカーを利用した、手術または放射線による乳癌治療に対する反応を評価するための方法、および本発明の方法の使用のためのキットを含む。
別段の表示がない限り、核酸配列は、左から右に、5’から3’方向に書かれる。本願明細書で挙げられる数値的範囲は、範囲を定める数字を含み、定義された範囲内の各整数またはいずれの非整数有理数(画分)を含む。別段の定義がない限り、本願明細書で使用される全ての技術用語および科学用語は、本発明が関与する技術分野の当業者によって通常理解されるものと同義である。
下記の用語は、本願の構成では、下記に示される意味を有するものとする。「多型マーカー」は、「マーカー」と呼ばれることもあり、本願明細書記載のように、ゲノム多形性部位を意味する。各多型マーカーは、多形性部位の特定の対立遺伝子に特徴のある少なくとも2つの配列多様性を有する。従って、多型マーカーの遺伝的関連は、その特定の多型マーカーの少なくとも1つの特異的な対立遺伝子に関連があることを意味する。当該マーカーは、一塩基多型(SNP)、ミニサテライトまたはマイクロサテライト、転座およびコピー数の変異(挿入、欠失、重複)を含む、ゲノム中に見出されるいずれの変異型のいずれの対立遺伝子を含み得る。多型マーカーは、集団における測定可能な頻度のいずれであってもよい。疾病遺伝子のマッピングのためには、集団頻度が5〜10%よりも高い多型マーカーが一般的に最も有用である。しかし、多型マーカーもまた、特定のコピー数変異(CNV)について、より低い集団頻度(1〜5%頻度、またはさらに低い頻度など)を有するかも知れない。当該用語は、本願の構成においては、いずれの集団頻度の多型マーカーを含むように解釈されるものとする。
「対立遺伝子」は、染色体の所定の遺伝子座(位置)のヌクレオチド配列を意味する。多型マーカー対立遺伝子は、従って、染色体上のマーカーの構成(すなわち、配列)を意味する。個体のゲノムDNAは、各染色体上のマーカーの各コピーを代表する、いずれの所定の多型マーカーの2つの対立遺伝子を含む。本願明細書で使用されるヌクレオチドの配列コードは、A=1、C=2、G=3、T=4である。マイクロサテライト対立遺伝子のために、CEPH試料(ヒト多型研究センター、ゲノム貯蔵所、CEPH試料1347−02)を参照として使用し、試料中の各マイクロサテライトのより短い対立遺伝子を0と設定し、他の試料中の全ての他の対立遺伝子に、当該参照に関連して番号を付けた。従って、例えば、対立遺伝子1は、CEPH試料中のより短い対立遺伝子より1bp長く、対立遺伝子2は、CEPH試料中のより短い対立遺伝子より2bp長く、対立遺伝子3はCEPH試料中の下位の対立遺伝子より3bp長い、などであり、対立遺伝子−1は、CEPH試料中のより短い対立遺伝子よりも1bp短く、対立遺伝子−2は、CEPH試料中のより短い対立遺伝子より2bp短い、などである。
「一塩基多型」または「SNP」は、ゲノムの特異的な部位の1つのヌクレオチドが種のメンバー間または個体の対の染色体間で異なる場合に生じる、DNA配列の多様性である。大部分のSNP多型は、2つの対立遺伝子を有する。当該例では、各個体は、多型の1つの対立遺伝子のホモ接合(すなわち、個体の染色体のコピーの両方が、SNP部位の同一のヌクレオチドを有する)であるか、または、個体はヘテロ接合(すなわち、異なるヌクレオチドを含む個体の2つの姉妹染色体)である。本願明細書で報告されたSNPの命名は、国立バイオテクノロジー情報センター(NCBI)によって各特有のSNPに指定された公式の参照SNP(rs)ID同定タグを意味する。
本願明細書記載の配列コヌクレオチド(conucleotide)の多義性は、IUPAC−IUBによって提唱される通りである。これらのコードは、EMBL、GenBank、およびPIRデータベースによって使用されるコードと両立する。
1より大きい配列が集団(自然の集団または合成の集団(例えば、合成分子のライブラリー)のいずれか)において可能性のあるヌクレオチドの位置は、本願明細書では「多形性部位」と呼ばれる。
「変異」は、本願明細書記載のように、参照DNAと異なるDNAの分節を意味する。「マーカー」または「多型マーカー」は、本願明細書に定義されるように、変異である。参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれる。
「マイクロサテライト」は、特定の部位の長さが2〜8ヌクレオチドの塩基の複数の小さい反復(CA反復など)を有する多型マーカーであり、反復長の数は一般的な集団において変化する。
「インデル」は、典型的にはわずか数ヌクレオチド長の小さな挿入または欠損を含む、多型性の一般的な形態である。
「ハプロタイプ」は、本願明細書記載のように、分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられる一本鎖DNA内のゲノムDNAの分節を意味する。ヒトなどの2倍体の生物では、ハプロタイプは各多型マーカーまたは遺伝子座の対の対立遺伝子の1つのメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子を含み得る。
(p17)用語「感受性」は、本願明細書に記載されるように、増加した感受性および減少した感受性の両方を包含する。従って、本発明の特定の多型マーカーおよび/またはハプロタイプは、1よりも大きい相対リスク(RR)によって特徴付けられるように、または1よりも大きいオッズ比(OR)であるように、乳癌の増加した感受性(すなわち、増加したリスク)の特性を示していてもよい。あるいは、本発明のマーカーおよび/またはハプロタイプは、1未満の相対リスクまたは1未満のオッズ比によって特徴付けられるように、乳癌の減少した感受性(すなわち、減少したリスク)の特徴を表わす。ハプロタイプは、本願明細書では、マーカー名およびそのハプロタイプのマーカーの対立遺伝子に関連して記載され、例えば、「T rs4415084」は、そのハプロタイプ中のマーカーrs4415084のT対立遺伝子を意味し、この命名は、「rs4415084 対立遺伝子T」および「T−rs4415084」に等しい。さらに、ハプロタイプにおける対立形質のコードは、個体マーカーについてのものと同じようであり、すなわち、1=A、2=C、3=Gおよび4=Tである。
用語「感受性」は、本願明細書記載のように、ある状態(例えば、ある形質、表現型または疾病(例えば、乳癌))の発生または、平均的な個体よりも特定の状態に抵抗できないことに対する個体の易発性を意味する。当該用語は、増加した感受性および減少した感受性の両方を包含する。従って、本発明の多型マーカーにおける特定の対立遺伝子および/またはハプロタイプは、本願明細書に記載されるように、1より大きいその特定の対立遺伝子またはハプロタイプの相対リスク(RR)、またはオッズ比(OR)によって特徴付けられるように、乳癌の増加した感受性(すなわち、増加したリスク)に特徴があってもよい。あるいは、本発明のマーカーおよび/またはハプロタイプは、1未満の相対リスクによって特徴付けられるように、乳癌の減少した感受性(すなわち、減少したリスク)に特徴がある。
用語「および/または」は、本願の構成では、当該用語によって結合された項目のいずれかまたは両方が関連することを示すことが理解されるだろう。換言すれば、本願明細書における用語は、「いずれかまたは両方」を意味することが捉えられるだろう。
用語「検査表」は、本願明細書記載のように、データの一形態を別の形態と関連付ける表、または、1もしくは複数の形態のデータを、当該データが関連する予測される成果(表現型または形質など)と関連付ける表である。例えば、検査表は、少なくとも1つの多型マーカーの対立遺伝子のデータと、特定の対立遺伝子のデータを含む個体が、示しやすいまたは特定の対立遺伝子のデータを含まない個体よりも示しやすい特定の形質もしくは表現型(特定の疾病診断など)との間の相関を含み得る。検査表は、多次元的であり得、すなわち、単一のマーカーの複数の対立遺伝子についての情報を同時に含み得、または、複数のマーカーについての情報を含み得、他の因子(疾病診断の特徴、人種の情報、バイオマーカー、生化学的測定、治療方法または薬剤など)も含んでいてもよい。
「コンピューター可読媒体」は、市販または特注のインターフェースを使用した、コンピューターによって接続され得る情報記憶媒体である。典型的なコンピューター可読媒体は、メモリ(例えば、RAM、ROM、フラッシュメモリ、など)、光学式記憶媒体(例えば、CD−ROM)、磁気記憶媒体(例えば、コンピューターのハードドライブ、フロッピー(登録商標)ディスク、など)、パンチカードまたは他の市販の媒体を含む。情報は、興味のあるシステムと媒体との間、コンピューター間、またはコンピューターと、記憶した情報を保存または接続するコンピューター可読媒体との間で転送されてもよい。このような転送は、電気的であり得、または他の利用可能な方法(IRリンク、無線接続など)によってもよい。
「核酸試料」は、核酸(DNAまたはRNA)を含む個体から得られた試料である。ある実施態様、すなわち、特異的な多型マーカーの検出および/またはハプロタイプの検出では、当該核酸試料はゲノムDNAを含む。このような核酸試料は、ゲノムDNAを含むいずれの供給源(血液試料、羊水試料、脳脊髄液試料、または皮膚、筋肉、頬側粘膜もしくは結膜粘膜、胎盤、消化管もしくは他の器官から得た組織試料を含む)からも得られ得る。
用語「乳癌の治療薬」は、乳癌に関連する症候の寛解または予防に使用され得る薬剤を意味する。
用語「乳癌に関連した核酸」は、本願明細書記載のように、乳癌に関連することが見出された核酸を意味する。これは、本願明細書記載のマーカーおよびハプロタイプ、ならびにそれらと強い連鎖不平衡(LD)のマーカーおよびハプロタイプを含むが、これらに限定されない。
用語「乳癌」は、本願明細書に記載されるように、乳癌のいずれかの臨床的診断を意味し、乳癌の特定の亜表現型のいずれかおよび全てを含む。例えば、乳癌は、エストロゲン受容体(ER)陽性の乳癌またはエストロゲン受容体陰性の乳癌として分類されることがある。乳癌はまた、プロゲステロン受容体(PR)陽性または陰性として分類されることもある。乳癌は、さらに、浸潤性乳管癌として、浸潤性小葉癌として、管状癌として、または他の浸潤性乳癌または混合型浸潤性乳癌として診断されることがある。乳癌はまた、髄様DCIS(非浸潤性乳管癌)またはLCIS(上皮内小葉癌、または他の非浸潤性乳癌として分類され得る。湿潤性乳癌はまた、ステージ0、ステージ1、ステージ2(ステージ2aおよびステージ2bを含む)、ステージ3(ステージ3a、ステージ3bおよびステージ3cを含む)またはステージ4乳癌として定められ得る。本願の構成においては、「乳癌」は、乳癌のこれらの亜表現型のいずれをも含むことができ、また、いずれの他の臨床的に適用できる乳癌の亜表現型をも含む。
用語「全ての乳癌」または「全てのBC」は、乳癌の特定の亜表現型と無関係に、乳癌と診断された全ての個体を意味する。
用語「媒体素因の」乳癌または「MedPreの」乳癌は、乳癌の亜表現型を意味する。当該表現型の定義は、発端者が少なくとも1つの下記の判断基準を満たすことを必要とする。当該発端者は、3減数分裂事象(減数分裂事象s)(3M)の遺伝的距離内の、3人以上の罹患した近親者を含む乳癌の症例の集団の一員である。当該発端者は、3M以内で関連する、罹患したペアの一員であり、ペアの一人は50歳以下のときに診断された。当該発端者は、3M以内で関連する、罹患したペアの一員であり、ペアの一人はいずれかのタイプの続発性原発腫瘍であると診断された。当該発端者は、いずれかのタイプの続発性原発腫瘍であると診断された。
用語「多発性原発性乳癌」、または「MPBC」は、本願明細書記載のように、最初の乳癌の診断に加えて少なくとも1つの原発性腫瘍が診断され、2つの腫瘍が臨床的に、かつ組織学的検査によって、別個の原発性腫瘍であることが確かめられ、最初の乳癌と同時に、またはその後に生じており、対側乳房または同側乳房に生じている症例を意味する。
用語「家族歴スコア」または「FHS」は、本願明細書記載のように、疾病の発端者の乳癌に罹患した近親者の数に基づいて定義される。各発端者について、スコア1は各罹患した一等親近親者に割り当てられ、0.5は各罹患した第二度近親者に割り当てられ、0.25は各第三度近親者に割り当てられる。従って、全ての罹患した近親者にわたって得られた累計は、合計された家族歴スコアまたはFHSを表す。
用語「エストロゲン受容体陽性の乳癌」、または「ER陽性の乳癌」は、本願明細書で定義されるように、エストロゲン受容体について陽性と判定された腫瘍を意味する。本願の構成においては、ERレベルが10fmol/mg以上、および/または免疫組織化学的な知見で陽性の核が10%以上であるときは、ER陽性であると考えられる。ER陽性であるという判断基準を満たさない乳癌は、本願明細書では、「ER陰性」または「エストロゲン受容体陰性」と定義される。
用語「プロゲステロン受容体陽性の乳癌」、または「PR陽性の乳癌」は、本願明細書に記載されるように、プロゲステロン受容体が陽性と判定された腫瘍を意味する。本願の構成においては、10fmol/mg以上のPRレベルおよび/または10%以上の陽性の核についての免疫組織化学的な知見は、PR陽性であると考えられる。PR陽性であるという判断基準を満たさない乳癌は、本願明細書では、「PR陰性」または「プロゲステロン受容体陰性」として定められる。
用語「染色体5p12」は、本願明細書に記載されるように、NCBI(国立バイオテクノロジー情報センター)ビルド34の位置44,094,392〜46,393,984の染色体5上の領域を意味する。
用語「FGF10」または「FGF10遺伝子」は、本願明細書に記載されるように、ヒト染色体5p上の線維芽細胞成長因子10遺伝子を意味する。
用語「MRPS30」または「MRPS30遺伝子」は、本願明細書に記載されるように、ヒト染色体5p上のミトコンドリアリボソームタンパク質S30遺伝子を意味する。この遺伝子はまた、プログラム細胞死タンパク質9(PDCD9)とも呼ばれ、ミトコンドリアのS28サブユニットをコードする。
用語「FGFR2」または「FGFR2遺伝子」は、本願明細書に記載されるように、ヒト染色体10q26上の線維芽細胞成長因子受容体2遺伝子を意味する。この遺伝子はまた、チロシンキナーゼ受容体様タンパク質14(TK14)、ケラチノサイト増殖因子受容体(KGFR)、および線維芽細胞成長因子受容体BEKとも呼ばれる。
本発明の乳癌と診断された個体の集団の関連分析を通じて、染色体5p12上のある多型マーカーのある対立遺伝子は、乳癌と関連することが発見された。癌と関連する変異体についてのゲノム全体での分析は、染色体5の領域(位置44,094,392〜46,393,984(NCBIビルド34の座標)、本願明細書では染色体5p12領域と呼ばれる)との乳癌の関連を明らかにした。特定のマーカーは、この領域において乳癌の増加したリスクと関連することが見出された。
イルミナ ヒトHap300マイクロアレイ技術を使用した、約1,600のアイスランド人の乳癌患者および11,563の対照の遺伝子型の同定を通じて、染色体5p上の多数のマーカーが、乳癌との関連を示すことが見出された(表1)。特に、マーカーrs4415084のT対立遺伝子、およびマーカーrs7703618のG対立遺伝子は、乳癌の増加したリスクと関連していることが見出された。マーカーrs7703618の関連は、第2のアイスランド人のコホートで再現され、関連シグナルは実際に明らかであることが示された。
アイスランド発見コホートと、公共のCGEMSデータセットとの比較は、rs4415084との関連もまた、このコホートで再現されたことを明らかにした。実際は、このマーカーへの関連シグナル(アイスランド人の発見コホートにおけるp値 9.02E−06)は、ゲノム全体レベルで有意であり(ボンフェローニ補正後)、2つのデータセットを合わせた場合、通常のp値は1.38E−07であった。このSNPは、CGEMSデータセット単独では目立たないP値(2.21E−03)を有していたが、アイスランド人の集団における当初の発見をまさに再現している。
マーカーrs10941679(マーカーrs4415084と相関している(D’=0.99、r2=0.51))は、乳癌とさらに強い相関を有している(OR=1.19、p値 2.2E−06)。追跡分析は、スウェーデン、オランダ、スペインおよび米国からのコホートの、rs4415084およびrs10941679によるシグナルを示している(表6参照)。
本発明はまた、Chr5p12領域における対立遺伝子の不均一性のエビデンスを示し、6つの同値類(鍵となるマーカーrs7703618、rs4415084、rs2067980、rs10035564、rs11743392およびrs7716600によって表される)が同定された。さらなる分析は、観察された関連シグナルは、主に、マーカーrs4415084およびrs10941679によって説明されることを証明した。
乳癌に関連しているマーカーおよびハプロタイプを内部に有している、本発明によって同定された領域に、注目すべき3つの既知の遺伝子がある。これらの遺伝子は、十分には特徴付けられていない遺伝子であるLOC441070のほか、FGF10、MRPS30、およびHCN1である。これらの遺伝子のうち2つ(FGF10およびMRPS30)は、乳癌の素因についての関与における有力な候補である。
従って、FGF10は、乳房の通常の胚発生に必要とされ(HowardおよびAshworth、(2006)、PLoS Genet、2、e112)、FGF10は、MMTV挿入変異原性による乳癌のマウスのモデルの癌遺伝子として関係づけられてきており、FGF10は、ヒト乳癌の約10%で過剰発現している(Theodorouら、(2004)、Oncogene、23、6047〜55)。FGF10遺伝子は、組み換えホットスポットによる関連シグナルの主要なクラスターから分離される。しかし、FGF10の制御を調節する鍵となる要素は、強い関連シグナルが生じる領域内に存在してもよい。あるいは、当該関連シグナルは、FGF10遺伝子それ自体の内の病原性変異体と連鎖不平衡であってもよい。
MRPS30遺伝子は、プログラム細胞死タンパク質9(PDCD9)としても知られ、ミトコンドリアの28S リボソームのサブユニットをコードする。この遺伝子は、ニワトリアポトーシス促進性タンパク質 p52の哺乳類における対応物である。これは、アポトーシスを引き起こし、哺乳類細胞におけるストレス応答性JNK1経路を活性化することが示されている。当該タンパク質は、Bcl−2経路を通じて少なくとも部分的にアポトーシスにおいて機能することが明らかになった(Sunら、(1998)、Gene、208、157〜66;Carimら、(1999)、Cytogenet Cell Genet、87、85〜8;Cavdar Kocら、(2001)、FEBS Lett、492、166〜70)。これは、以前に乳癌に関係付けられてはいないものの、上記経路におけるその関与は、MRPS30の遺伝的変異が、乳癌リスクの改変に関与しているかも知れないということを示唆する。
染色体10上の位置FGFR2のマーカーrs1219648は、乳癌のリスクを与え(表6)、特に、ER陽性の腫瘍に関連する(表10)ことも発見された。rs1219648との関連は、リンパ節陰性腫瘍よりもリンパ節陽性腫瘍においてより明らかであり、その関連は、乳癌の家族歴がある個体においてより強いことも発見された。
(マーカーおよびハプロタイプの評価)
集団内のゲノム配列は、個体を比較すると同一ではない。ある程度、ゲノムは、ゲノム中の多くの部位で、個体間の配列変異性を呈する。このような配列の変異は、通常、多型性と呼ばれ、各ゲノム内に多くのこのような部位がある。例えば、ヒトゲノムは、平均500塩基対ごとに生じる配列多様性を呈する。最も一般的な配列変異は、ゲノム中の単一の塩基位置の塩基変異からなり、このような配列変異、または多型性は、通常、一塩基多型(「SNP」)と呼ばれる。これらのSNPは、単一の突然変異事象によって生じていると考えられ、従って、通常、各SNP部位において可能性を有する、2つの可能性のある対立遺伝子がある(本来の対立遺伝子および変異した(一方の)対立遺伝子)。自然の遺伝的浮動、および、おそらくまた、選択圧によって、最初の変異は、いずれの所定の集団におけるその対立遺伝子の特定の頻度によって特徴付けられる多型性をもたらす。配列変異の多くの他の型は、ヒトゲノムにおいて見出され、ミニサテライトおよびマイクロサテライト、ならびに挿入、欠損、反転(コピー数多型(CNV)とも呼ばれる)を含む。多型のマイクロサテライトは、複数の小塩基反復(CA反復、相補鎖上のTGなど)を、反復長数が一般的な集団において異なる特定の部位に有する。一般的な用語では、多形性部位に関する配列の各バージョンは、多形性部位の特定の対立遺伝子を表す。全ての配列変異は、問題になっている配列変異を特徴付ける特定の多形性部位に生じる、多型性と呼ばれ得る。一般的な用語では、多型性は、あらゆる数の特定の対立遺伝子を含み得る。従って、本発明の1つの実施態様では、当該多型性は、いずれの所定の集団における2つ以上の対立遺伝子の存在によって特徴付けられる。別の実施態様では、当該多型性は、3つ以上の対立遺伝子の存在によって特徴付けられる。他の実施態様では、当該多型性は、4つ以上の対立遺伝子、5つ以上の対立遺伝子、6つ以上の対立遺伝子、7つ以上の対立遺伝子、9つ以上の対立遺伝子、または10以上の対立遺伝子によって特徴付けられる。全てのこのような多型性は、本発明の方法およびキットに使用され得、従って、本発明の範囲内である。
その存在量によって、SNPは、ヒトゲノムの配列変異性の大部分について説明する。600万超のSNPが、現在までに確認されている(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)。しかし、CNVは、ますます注目されている。これらの大規模な多型性(典型的には、1kb以上)は、構築されたヒトゲノムの実質的な割合に影響する多型の変異性を説明する。公知のCNVはヒトゲノム配列の15%超にわたる(covery)(Estivill,X Armengol;L.、PIoS Genetics 3:1787〜99(2007)。http://projects.tcag.ca/variation/)。しかし、これらの多型性のほとんどは、非常にまれであり、平均して、各個体のゲノム配列の一部分のみに影響する。CNVは、遺伝子量の撹乱による遺伝子発現、表現型の変異性および適応に影響することが知られ、また、疾病(微小欠失疾患および微小重複疾患)の原因となることも知られ、一般的な複合疾患(HIV−1感染および糸球体腎炎を含む)のリスクを与える(Redon、R.ら、Nature 23:444〜454(2006))。従って、前述のCNVまたは未知のCNVのいずれかが、乳癌と関連のある本願明細書に記載されたマーカーと連鎖不平衡の、原因となる変異体を表わす可能性がある。CNVの検出方法は、比較ゲノムハイブリダイゼーション(CGH)および遺伝子型の同定(Carter (Nature Genetics 39:S16〜S21(2007))によって記載されたように、遺伝子型の同定アレイの使用を含む)を含む。ゲノムの変異体のデータベース(http://projects.tcag.ca/variation/)は、記載されたCNVの位置、型および大きさについての最新の情報を含む。当該データベースは、現在、15,000超のCNVのデータを含む。
いくつかの例では、参照対立遺伝子を選択することなく、多形性部位の異なる対立遺伝子が参照される。あるいは、参照配列は、特定の多形性部位を意味し得る。参照対立遺伝子は、「野生型」の対立遺伝子と呼ばれることもあり、それは、通常第1に配列決定された対立遺伝子、または「非罹患の」個体(例えば、形質または疾病の表現型を示さない個体)からの対立遺伝子のいずれかとして選択される。
本願明細書で述べられたSNPマーカーの対立遺伝子は、使用されたSNPアッセイにおける多形性部位に生じる場合、塩基A、C、GまたはTを意味する。本願明細書で使用されるSNPについての対立遺伝子コードは、下記の通りである;1=A、2=C、3=G、4=T。しかし、当業者は、逆のDNA鎖のアッセイまたは解読によって、相補的な対立遺伝子が各症例において判定され得ることを理解するだろう。従って、A/G多型性によって特徴付けられる多形性部位(多型マーカー)について、使用されるアッセイは、可能性のある2つの塩基(すなわちAおよびG)のうち1つまたは両方の存在を特異的に検出するように設計されてもよい。あるいは、鋳型DNA上の逆ストランドを検出するように設計されたアッセイを設計することで、相補的塩基TおよびCの存在が判定され得る。(例えば、相対リスクに関して)量的に、同一の結果が、いずれかのDNA鎖(+鎖または−鎖)の判定から得られうる。
典型的には、参照配列は、特定の配列を意味する。当該参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれることもある。変異配列は、本願明細書で使用されるように、参照配列と異なる配列を意味するが、その他の点では実質的に類似である。本願明細書記載の多型の遺伝子マーカーの対立遺伝子は変異体である。変異体は、ポリペプチドに影響する変化を含み得る。配列の相違は、参照ヌクレオチド配列と比較した場合、以下を含み得る;フレームシフトをもたらす、1つのヌクレオチドの挿入もしくは欠損、または1より多いヌクレオチドの挿入もしくは欠損;コードされるアミノ酸中の変化をもたらす、少なくとも1つのヌクレオチドの変化;中途終止コドンの生成をもたらす、少なくとも1つのヌクレオチドの変化;ヌクレオチドによってコードされた1つまたは複数のアミノ酸の欠損をもたらす、いくつかのヌクレオチドの欠損;読み枠のコード配列の中断をもたらす、不等組み換えまたは遺伝子変換などによる1つまたはいくつかのヌクレオチドの挿入;全てまたは一部の配列の重複;転座;またはヌクレオチド配列の再編成。このような配列変化は、核酸によってコードされたポリペプチドを変化させ得る。例えば、核酸配列の変化がフレームシフトを引き起こすと、当該フレームシフトはコードされたアミノ酸の変化をもたらし得、および/または、切断されたポリペプチドの生成をもたらす、中途終止コドンの生成をもたらし得る。あるいは、疾病または形質に関連する多型性は、1つまたは複数のヌクレオチドにおける同義の変化(すなわち、アミノ酸配列の変化をもたらさない変化)であり得る。このような多型性は、例えば、スプライス部位を変化させ得、mRNAの安定性または輸送に影響し得、またはそうでなければコードされたポリペプチドの転写または翻訳に影響し得る。このような多型性はまた、構造の変化(増幅または欠損など)が体細胞レベルで生じる可能性を増加させるようにDNAを変化させ得る。参照ヌクレオチド配列にコードされたポリペプチドは、特定の参照アミノ酸配列を有する「参照」ポリペプチドであり、変異対立遺伝子によってコードされたポリペプチドは、変異アミノ酸配列を有する「変異」ポリペプチドと呼ばれる。
ハプロタイプは、当該分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられるDNAの分節を意味する。2倍体の生物(ヒトなど)では、ハプロタイプは、各多型マーカーまたは遺伝子座の対の対立遺伝子のうちの1のメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子(各対立遺伝子は分節に沿った特定の多型マーカーに対応する)を含み得る。ハプロタイプは、多形性部位において特定の対立遺伝子を有する、様々な多型マーカーの組み合わせ(例えば、SNPとマイクロサテライト)を含み得る。従って、ハプロタイプは、様々な遺伝子マーカーの対立遺伝子の組み合わせを含む。
特定の多型マーカーおよび/またはハプロタイプの検出は、多形性部位の配列の検出のための、当該技術分野で公知の方法によって達成され得る。例えば、SNPおよび/またはマイクロサテライトマーカーの存在についての遺伝子型の同定の標準的な技術(PCR、LCR、ネステッドPCRおよび核酸増幅のための他の技術を用いた、蛍光に基づいた技術(Chen X.ら、Genome Res.9(5):492〜98(1999))など)が使用され得る。SNP遺伝子型の同定について利用可能な特定の市販の方法論は、TaqMan 遺伝子型の同定アッセイおよびSNPlex プラットフォーム(アプライドバイオシステムズ(Applied Biosystems))、ゲル電気泳動(アプライドバイオシステムズ)、質量分析(例えば、 MassARRAYシステム、シーケノム(Sequenom))、ミニ配列分析法、リアルタイムPCR、Bio−Plexシステム(バイオラッド(BioRad))、CEQおよびSNPstreamシステム(ベックマン(Beckman))、アレイハイブリダイゼーション技術(例えば、Affymetrix遺伝子チップ、パーレジェン(Perlegen))、ビーズアレイ技術(例えば、イルミナ GoldenGateおよびInfiniumアッセイ)、アレイタグ技術(例えば、Par対立遺伝子)、およびエンドヌクレアーゼに基づいた蛍光ハイブリダイゼーション技術(インベーダー法、サードウェイブ(Third Wave))を含むが、これらに限定されない。利用できるアレイプラットフォームのいくつか(アフィメトリクス(Affymetrix)SNPアレイ 6.0およびイルミナ CNV370−デュオ(Duo)および1M ビーズチップス(BeadChips)を含む)は、あるCNVをタグするSNPを含む。これにより、これらのプラットフォームに含まれた代替のSNPによって、CNVの検出が可能となる。当業者に利用可能なこれらのまたは他の方法の使用によって、多型マーカーの1つまたは複数の対立遺伝子(マイクロサテライト、SNPまたは他のタイプの多型マーカーを含む)を同定し得る。
本願明細書記載のある方法では、乳癌に対して増加した感受性(すなわち、増加したリスク)を有する個体は、乳癌について増加した感受性を与える1つまたは複数の多型マーカーまたはハプロタイプの少なくとも1つの特定の対立遺伝子が同定された(すなわち、リスクのあるマーカー対立遺伝子またはハプロタイプ)個体である。1つの態様では、当該リスクのあるマーカーまたはハプロタイプは、乳癌の有意に増加したリスク(または感受性)を与えるものである。1つの実施態様では、マーカーまたはハプロタイプに関連する有意性は、相対リスク(RR)によって判定される。別の実施態様では、マーカーまたはハプロタイプに関連する有意性は、オッズ比(OR)によって判定される。さらなる実施態様では、当該有意性は、割合(%)によって判定される。1つの実施態様では、有意に増加したリスクは、少なくとも1.10のリスク(相対リスクおよび/またはオッズ比)(少なくとも1.11、少なくとも1.12、少なくとも1.13、少なくとも1.14、少なくとも1.15、少なくとも1.16、少なくとも1.17、少なくとも1.18、少なくとも1.19、少なくとも1.20、少なくとも1.21、少なくとも1.22、少なくとも1.23、少なくとも1.24、少なくとも1.25、少なくとも1.30、少なくとも1.35、少なくとも1.40、少なくとも1.50、少なくとも1.60、少なくとも1.70、1.80、少なくとも1.90、少なくとも2.0、少なくとも2.5、少なくとも、3.0、少なくとも4.0、および少なくとも5.0を含むがこれらに限定されない)として測定される。特定の実施態様では、少なくとも1.15のリスク(相対リスクおよび/またはオッズ比)が有意である。別の特定の実施態様では、少なくとも1.17のリスクが有意である。さらに別の実施態様では、少なくとも1.20のリスクが有意である。さらなる実施態様では、少なくとも約1.25の相対リスクが有意である。別のさらなる実施態様では、リスクの有意な増加は、少なくとも約1.30が有意である。しかし、他のカットオフもまた考えられ、例えば、少なくとも1.16、1.18、1.19、1.21、1.22、など、およびこのようなカットオフもまた本発明の範囲内である。他の実施態様では、リスクの有意な増加は、少なくとも約10%(約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、および約100%を含むがこれらに限定されない)である。1つの特定の実施態様では、リスクの有意な増加は、少なくとも15%である。他の実施態様では、リスクの有意な増加は、少なくとも17%、少なくとも20%、少なくとも22%、少なくとも24%、少なくとも25%、少なくとも30%、少なくとも32%および少なくとも35%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。ある実施態様では、リスクの有意な増加は、p値が0.05未満、0.01未満、1×10−3(0.001)未満、1×10−4(0.0001)未満、1×10−4(0.00001)未満、1×10−5(0.000001)未満、1×10−6(0.0000001)未満、1×10−7(0.00000001)未満、または1×10−8(0.000000001)未満などの、p値によって特徴付けられる。
本発明のリスクのある多型マーカーまたはハプロタイプは、少なくとも1つのマーカーまたはハプロタイプの少なくとも1つの対立遺伝子が、比較群(対照)におけるその存在の頻度と比較して、疾病もしくは形質のリスクのある(罹患した)、または疾病もしくは形質と診断された個体においてより頻繁に存在するものであり、当該マーカーまたはハプロタイプの存在が疾病または形質(例えば、乳癌)に対する感受性を示す。1つの実施態様では、対照群は、集団の試料、すなわち一般的な集団から得た確率標本であってもよい。対照群は、別の実施態様では、疾病フリーの個体群(すなわち、乳癌と診断されていない個体)によって表される。このような疾病フリーの対照は、1つの実施態様では、1つまたは複数の特定の疾病に関連する症候の不存在によって特徴付けられてもよい。別の実施態様では、当該疾病フリーの対照群は、1つまたは複数の疾病特異的な危険因子の不存在によって特徴付けられる。このような危険因子は、1つの実施態様では、少なくとも1つの環境的なリスク因子である。代表的な環境的因子は、特定の疾病または形質について発生のリスクに影響することが知られる、または影響すると考えられる天然物、鉱物または他の化学薬品である。他の環境的な危険因子は、生活スタイルに関連する危険因子である(飲食の習慣、主な居住環境の地理的な位置、および職業性危険因子を含むが、これらに限定されない)。別の実施態様では、危険因子は、少なくとも1つの遺伝的危険因子である。
相関についての簡易な試験の例は、2×2の表のフィッシャーの正確確率検定であり得る。所定の染色体コホートについて、マーカーまたはハプロタイプの両方を含む染色体数、マーカーまたはハプロタイプのうち片方のみを含むが、もう片方は含まない染色体数、およびマーカーまたはハプロタイプのどちらも含まない染色体数から、2×2の表が作成される。当業者に知られた他の関連の統計検定もまた考えられ、これらもまた本発明の範囲内である。
本発明の他の実施態様では、疾病または形質について減少した感受性(すなわち、減少したリスク)を有する個体は、疾病または形質について減少した感受性を与える1つまたは複数の多型マーカーまたはハプロタイプの少なくとも1つの特定の対立遺伝子が同定された個体である。減少したリスクを与えるマーカー対立遺伝子および/またはハプロタイプはまた、保護的であると言える。1つの態様では、保護マーカーまたはハプロタイプは、疾病または形質の有意に減少したリスク(または感受性)を与えるものである。1つの実施態様では、有意に減少したリスクは、0.90未満の相対リスク(0.85未満、0.80未満、0.75未満、0.7未満、0.6未満、0.5未満、0.4未満、0.3未満、0.2未満および0.1未満を含むが、これらに限定されない)として判定される。1つの特定の実施態様では、有意に減少したリスクは0.90未満である。別の実施態様では、有意に減少したリスクは、0.85未満である。さらに別の実施態様では、有意に減少したリスクは、0.80未満である。別の実施態様では、リスク(または感受性)の減少は、少なくとも10%(少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%および少なくとも98%を含むが、これらに限定されない)である。1つの特定の実施態様では、リスクの有意な減少は、少なくとも約15%である。別の実施態様では、リスクの有意な減少は、少なくとも約20%である。別の実施態様では、リスクの減少は、少なくとも約25%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。
当業者は、2つの対立遺伝子を有する多型マーカーが、検討された集団に存在し(SNPなど)、1つの対立遺伝子が、当該集団において形質または疾病を有する個体群中で増加した頻度が見出されると、対照と比較して、マーカーのもう1つの対立遺伝子は、形質または疾病を有する個体群中で、対照と比較して、減少した頻度で見出されることが理解するだろう。このような場合は、マーカーの1つの対立遺伝子(形質または疾病を有する個体中で増加した頻度で見出されたもの)は、リスクのある対立遺伝子であり、一方、もう1つの対立遺伝子は保護的対立遺伝子となるだろう。
疾病または形質(例えば、乳癌)に関連する遺伝的変異は、所定の遺伝子型についての疾病のリスクを予測するために、単独で使用され得る。2対立形質のマーカー(SNPなど)については、3つの可能性のある遺伝子型がある(リスク変異のホモ接合体、ヘテロ接合体、およびリスク変異の非保有者)。複数の座位の変異と関連するリスクは、全体のリスクの評価に使用され得る。複数のSNP変異については、k個の可能性のある遺伝子型(k=3n´2p)がある。nは、常染色体の座位数であり、pは、ゴノソーマルな(gonosomal)(性染色体の)座位数である。全体のリスクアセスメントの算出は、通常、異なる遺伝的変異の相対リスクが掛かる、すなわち、特定の遺伝子型の組み合わせと関連する全体のリスク(例えば、RRまたはOR)が、各遺伝子座の遺伝子型のリスク値の積であることを想定している。性別および民族性をマッチさせた参照集団と比較して、示されたリスクが、ヒトまたはヒトの特定の遺伝子型の相対リスクである場合は、複合リスクは遺伝子座特異的なリスク値の積であり、また、これは当該集団と比較した全体的のリスク推定値と一致する。ヒトのリスクが、リスク対立遺伝子の非保有者との比較に基づく場合、複合リスクは、全ての座位の遺伝子型の所定の組み合わせを有する個人を、これらの座位のいずれのリスク変異も有さない個体群と比較した推定値と一致する。いずれのリスク変異も有さない非保有者群は、最も低いリスク推定値を有し、自身(すなわち、非保有者)と比較した複合リスクが1.0であるが、集団と比較した全体のリスクは1.0未満である。非保有者群は潜在的に、特に多数の座位について、非常に小さいものであり得ることに注意すべきであり、この場合、その関連性は同様に小さい。
複合モデルは、通常、複合形質のデータにまずまず適合する簡潔なモデルである。多重度からの偏差は、一般的な疾病の一般的な変異に関連してまれに記載され、報告されたとしても、座位間の統計的相互作用を示すことができるように、非常に大きなサンプルサイズが通常要求されることから、通常、示唆的であるのみである。
例えば、前立腺癌に関連すると記載されている計8の変異(Gudmundsson、J.ら、Nat Genet 39:631〜7(2007)、Gudmundsson、J.ら、Nat Genet 39:977〜83(2007);Yeager、M.ら、Nat Genet 39:645〜49(2007)、Amundadottir、Lら、Nat Genet 38:652〜8(2006);Haiman、CA.ら、Nat Genet 39:638〜44(2007))について検討したい。これらの座位のうち7つは、常染色体上にあり、残る遺伝子座はX染色体上にある。理論上の遺伝子型の組み合わせの総数は、37´21=4374である。これらの遺伝子型のクラスのいくつかは非常にまれであるが、依然として可能性があり、全体のリスクアセスメントに考慮されるべきである。複数の遺伝的変異の場合に適用される複合モデルはまた、遺伝的変異が「環境的な」因子と明瞭に相関していないとすると、非遺伝的危険変異と合わせることが妥当であろうと思われる。換言すれば、遺伝的リスクおよび非遺伝的リスクのある変異は、非遺伝的危険因子および遺伝的危険因子が相互作用していないとすると、複合リスクを推定するために複合モデル下で評価し得る。
同様の定量的アプローチを使用し、乳癌に関連する多数の変異に関連する複合または全体のリスクを評価してもよい。
(連鎖不平衡)
各減数分裂事象の間に各染色体対に平均1度生じる、組み換えの自然現象は、自然が配列変異(および、結果生じる生物学的機能)をもたらす1つの方法を表す。組み換えはゲノム中でランダムには生じないことが発見された。ある程度、組み換え率の頻度に大きな変異があり、高い組み換え頻度の小領域(組み換えホットスポットとも呼ばれる)、および、低い組み換え頻度のより大きな領域(通常、連鎖不平衡(LD)ブロックと呼ばれる)をもたらす(Myers、S.ら、Biochem Soc Trans 34:526〜530(2006);Jeffreys、AJ.ら、Nature Genet 29:217〜222(2001);May、C.A.ら、Nature Genet 31:272〜275(2002))。
連鎖不平衡(LD)は、2つの遺伝因子の非ランダム分類を意味する。例えば、特定の遺伝因子(例えば、多型マーカーの対立遺伝子、またはハプロタイプ)が0.50(50%)の頻度で集団に生じ、別の因子が0.50(50%)の頻度で生じると、当該因子のランダム分布を仮定すると、ヒトが両因子を有すると予測される発生率は0.25(25%)である。しかし、2つの因子が0.125より高い頻度でともに生じることが発見されると、それらの別個の発生頻度(例えば、対立遺伝子またはハプロタイプの頻度)における予測よりも高い割合で、ともに遺伝する傾向にあるため、当該因子は、連鎖不平衡であると言える。大まかに言うと、LDは、一般的に、2つの因子間の組み換え事象の頻度と相関する。対立遺伝子またはハプロタイプの頻度は、集団内の個体の遺伝子型の同定、および集団の各対立遺伝子またはハプロタイプの発生頻度の測定によって、集団において判定し得る。二倍体の集団(例えば、ヒト集団)については、個体は、典型的に各遺伝因子について2つの対立遺伝子を有するだろう(例えば、マーカー、ハプロタイプまたは遺伝子)。
多くの異なる基準が、連鎖不平衡(LD;Devlin、B.およびRisch、N.、Genomics 29:311〜22(1995)において概説されている)の強さの評価について提案されてきた。大部分は、対の2対立形質の部位間の関連の強さをとらえる。2つの重要な対のLDの基準は、r2(□Δ2と表示されることもある)および|D’|である(Lewontin、R.、Genetics 49:49〜67(1964);Hill、W.G.およびRobertson、A.Theor.Appl.Genet.22:226〜231(1968))。両基準とも、0(不平衡がない)から1(「完全な」不平衡)の範囲であるが、それらの解釈は少し異なる。|D’|は、2つまたは3つのみの可能性のあるハプロタイプが存在する場合1に等しく、全ての4つの可能性のあるハプロタイプが存在する場合に<1となるように定義される。従って、<1の|D’|値は、背景の組み換えが、2つの部位間(再発性変異もまた、|D’|を<1にし得るが、一塩基多型(SNP)については、これは通常、組み換えよりも可能性が少ないと考えられる)で起きたかも知れないことを示す。基準のr2は、2つの部位間の統計的相関を表し、2つのハプロタイプのみが存在する場合は、値は1である。
r2基準は、r2と、感受性座位とSNPとの間の関連を検出するのに必要な試料サイズとの間に単純な逆の関連性があるため、関連マッピングについてのほぼ間違いなく最も関連する基準である。これらの基準は、対の部位について定義されるが、いくつかの適用については、どの位強いLDが、多くの多形性部位を含む全体の領域をわたっているかについての判定が望ましいだろう(例えば、LDの強さが座位間もしくは集団にわたって有意に異なっているかについての試験、または特定のモデル下で、領域に、予測されるよりも多かれ少なかれLDがあるかについての試験)。領域に渡るLDの測定は、直接ではないが、1つのアプローチは、集団遺伝子において得られる、基準rを使用することである。大まかに言うと、rは、データに見られるLDを生じるため、特定の集団モデル下で、どの位の組み換えが必要とされるかを判定する。この型の方法はまた、潜在的に、LDデータが組み換えホットスポットの存在についてのエビデンスを提供するかどうかについての決定の問題に対する、統計的に厳密なアプローチを提供し得る。本願明細書記載の方法において、遺伝的な分節(SNPマーカーなど)の間の有意なr2値は、少なくとも0.1(少なくとも0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99または1.0など)であり得る。1つの好ましい実施態様では、有意なr2値は、少なくとも0.2であり得る。あるいは、連鎖不平衡は、本願明細書記載のように、少なくとも0.2の|D’|値(0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99など)によって特徴付けられる連鎖不平衡を意味する。従って、連鎖不平衡は、異なるマーカーの対立遺伝子の間の相関を表す。連鎖不平衡は、相関係数または|D’|(r2値は1.0以下、および|D’|値は1.0以下)によって判定される。連鎖不平衡は、本願明細書で定義されたように、単一のヒト集団において判定し得、または1人より多いヒト集団からの個体を含む試料の収集物において判定し得る。本発明の1つの実施態様では、LDは、(http://www.hapmap.org)で定義されたように、1つまたは複数のHapMap集団(コーカサス人、アフリカ人、日本人、中国人)から得られた試料で判定される。このような実施態様の1つでは、LDは、HapMap試料のCEU集団で判定される。別の実施態様では、LDは、YRI集団において判定される。別の実施態様では、LDは、ヨーロッパ人の集団で判定される。さらに別の実施態様では、LDは、アイスランド人の集団で判定される。
ゲノム中の全ての多型性が、集団レベルで同一の場合、それらのことごとくが、関連研究において検討されることが必要だろう。しかし、多型間の連鎖不平衡により、密接に連鎖した多型は強く関連し、有意な関連を観察するために関連研究において検討される必要がある多型の数は減る。LDの別の結果は、多くの多型が、これらの多型が強く関連するという事実によって関連シグナルを与えてもよい、ということである。
ゲノムLDマップは、ゲノムにわたって作成されてきており、このようなLDマップは、疾病遺伝子のマッピングのためのフレームワークとして役立つと提案されてきている(Risch N.およびMerkiangas K、Science 273:1516〜1517(1996);Maniatis N.ら、Proc Natl Acad Sci USA 99:2228〜2233(2002);Reich DEら、Nature 411:199〜204(2001))。
今では、ヒトゲノムの多くの部分が、少数の共通のハプロタイプを含む一連の別々のハプロタイプブロックに切断され得ることが確立されている。これらのブロックについては、連鎖不平衡データは、組み換えを示すエビデンスをわずかに提供するにすぎない(例えば、Wall.、J.D.およびPritchard、J.K.、Nature Reviews Genetics 4:587〜597(2003);Daly M.ら、Nature Genet.29:229〜232(2001);Gabriel S.B.ら、Science 296:2225〜2229(2002);Patil N.ら、Science 294:1719〜1723(2001);Dawson E.ら、Nature 418:544〜548(2002);Phillips M.S.ら、Nature Genet.33:382〜387(2003)を参照)。
これらのハプロタイプブロックを定義する2つの主な方法がある。ブロックは、限られたハプロタイプの多様性を有するDNAの領域(例えば、Daly M.ら、Nature Genet.29:229〜232(2001);Patil N.ら、Science 294:1719〜1723(2001);Dawson E.ら、Nature 418:544〜548(2002);Zhang K.ら、Proc.Natl.Acad.Sci.USA 99:7335〜7339(2002)参照)、または、連鎖不平衡を使用して同定された、広範な背景の組み換えを有する転位ゾーン間の領域(例えば、Gabriel S.B.ら、Science 296:2225〜2229(2002);Phillips M.S.ら、Nature Genet.33:382〜387(2003);Wang N.ら、Am.J.Hum.Genet.71:1227〜1234(2002);Stumpf M.P.およびGoldstein D.B.、Curr.Biol.13:1〜8(2003)参照)として定義され得る。つい最近では、ヒトゲノムにわたる組み換え率および対応するホットスポットの、詳細なスケールのマップが、作成されてきている(Myers S.ら、Science 310:321〜32324(2005);Myers S.ら、Biochem Soc Trans 34:526530(2006))。当該マップは、組み換え率が、ホットスポット中で10〜60cM/Mbほど高く、一方、介在性領域では0に近く、従って、限られたハプロタイプの多様性および高いLDの領域を表す、ゲノムにわたる組み換えにおける莫大な変異を明らかにした。従って、当該マップは、組み換えホットスポットに隣接した領域として、ハプロタイプブロック/LDブロックを定義することに使用され得る。本願明細書で使用されるように、用語「ハプロタイプブロック」または「LDブロック」は、上述の特性、またはこのような領域を定義するために当業者によって使用される他の別の方法のいずれかによって定義されるブロックを含む。
従って、ゲノム中の多型マーカーへの、所定の認められた関連のいずれについても、ゲノム中のさらなるマーカーもまた関連を示す可能性があることが明らかになって来た。このことは、組み換え率の大きな変動によって認められたように、ゲノムにわたるLDの不均等な分布の当然の結果である。従って、関連の検出のために使用されたマーカーは、ある意味では、所定の疾病または形質と関連する、ゲノム領域(すなわち、ハプロタイプブロックまたはLDブロック)の「タグ」を表す。1つまたは複数の原因である(機能的)変異体または変異は、疾病または形質に関連することが見出された領域内に属していてもよい。機能的な変異体は、別のSNP、タンデムリピート多型性(ミニサテライトまたはマイクロサテライトなど)、転位因子、またはコピー数の変異(逆位、欠損または挿入など)であってもよい。本願明細書に記載された変異体とLDにある、このような変異は、関連の検出のために使用されたタグしたマーカーについて認められたものより、高い相対リスク(RR)またはオッズ比(OR)を与えてもよい。従って、本発明は、本願明細書記載の疾病の関連の検出のために使用されたマーカー、および当該マーカーとの連鎖不平衡のマーカーを意味する。従って、本発明のある実施態様では、本願明細書記載のように、本発明のマーカーおよび/またはハプロタイプとLDのマーカーは、代替のマーカーとして使用されてもよい。代替のマーカーは、1つの実施態様では、相対リスク(RR)および/またはオッズ比(OR)の値が、本願明細書記載のように、疾病に関連することが最初に見出されたマーカーまたはハプロタイプのものより小さい。他の実施態様では、代替のマーカーは、RRまたはOR値が、本願明細書記載のように、疾病に関連することが最初に見出されたマーカーで最初に判定されたものより大きい。このような実施態様の例は、本願明細書記載の変異体などの当該疾病と関連することが最初に見出された、より一般的な変異体(>10%集団における頻度)とLDにある、まれ、または相対的にまれ(対立遺伝子の集団における頻度が<10%)な変異体であろう。本願明細書記載のように発明者らによって発見された関連の検出のために、このようなマーカーを同定および使用することは、当業者に周知のルーチンの方法によって行われ得、従ってこれらは本発明の範囲である。
(ハプロタイプ頻度の測定)
患者および対照群におけるハプロタイプの頻度は、期待値最大化アルゴリズムを使用して評価され得る(Dempster A.ら、J.R.Stat.Soc.B、39:1〜38(1977))。フェーズとともに、欠損した遺伝子型および不確定度を扱うことができる当該アルゴリズムの実行が使用され得る。帰無仮説下では、患者および対照は、同一の頻度を有すると想定される。尤度法を使用し、別の仮説が検討され、候補のリスクのあるハプロタイプ(本願明細書記載のマーカーを含み得る)は、対照よりも患者において高い頻度を有していてもよく、一方、他のハプロタイプの頻度の割合は、両群で同一であると想定される。尤度は、両仮説下で別々に最大化され、対応する1−dfの可能性の割合の統計量は、統計的有意性を評価するために使用される。
感受性領域内(例えば、LDブロック領域内)のリスクのあるマーカーおよび保護マーカーならびにハプロタイプを探索するため、当該領域内の遺伝子型を同定されたマーカーの全ての可能性のある組み合わせの関連が検討される。合わされた患者および対照群は、本来の患者群および対照群とサイズが等しい、ランダムに2つのセットに分けられ得る。次いで、マーカーおよびハプロタイプ分析は、繰り返され、最も有意な記載されたp値が判定された。当該ランダム化スキームは、例えば、実験に基づいたp値の分布を作成するために、100回を超えて繰り返され得る。好ましい実施態様では、p値が<0.05であることは、有意なマーカーおよび/またはハプロタイプの関連性を示す。
(ハプロタイプ分析)
ハプロタイプ分析の1つの一般的なアプローチは、ネステッド(NEsted)モデルに適用した尤度に基づいた推論の使用に関する(Gretarsdottir S.ら、Nat.Genet.35:131〜38(2003))。当該方法は、多くの多型マーカー、SNPおよびマイクロサテライトに適用してもよい、プログラムNEMOで行われる。当該方法およびソフトウェアは、異なるリスクを与えるハプロタイプ群を同定することを目的とする、症例と対照の研究のために特に設計される。これはまた、LD構造を研究するためのツールである。NEMOでは、EMアルゴリズムを活用して、最尤推定値、尤度比およびp値が直接的に算出され、観察されたデータについては欠損データの問題として扱う。
フェーズにおける不確定度および欠損遺伝子型による情報の損失をとらえる、観察されたデータについて直接的に算出される尤度に基づく尤度比試験は、所定の妥当なp値に依存し得るが、どの位の量の情報が情報が不完全であることで失われているのかについて知ることは依然として興味深い。ハプロタイプ分析のための情報測定は、NicolaeおよびKong(Technical Report 537、シカゴ大学、統計大学(University of Statistics)、統計学科;Biometrics、60(2):368〜75(2004))に、連鎖分析のために定義された情報測定の自然な伸長として記載され、NEMOにおいて実行される。
疾病に関連する単一のマーカーについては、各個体の対立遺伝子の両側p値を算出するために、フィッシャーの直接確率検定が使用され得る。通常は、全てのp値は、特に示されない限り、多重比較について未調整で示される。(マイクロサテライト、SNPおよびハプロタイプについて)示された頻度は、保有者頻度とは対照的な対立遺伝子の頻度である。連鎖分析について家族として補充された患者の関連性による偏りを最小化するため、第一および第二度近親者は患者リストから除去され得る。さらに、当該検定は、Risch N.およびTeng J.(Genome Res.、8:1273〜1288(1998)において記載された、同胞群のための分散調整の手順を拡張することで、患者間の残存する関連性の関連補正のために繰返され得(Genome Res.、8:1273〜1288(1998))、一般的な家族性の関連に適用され得、比較のため、調製したp値および未調整のp値を両方示し得る。ゲノム制御の方法(Devlin,B.およびRoeder,K.Biometrics 55:997(1999))はまた、個体および可能な層別化の関連性を調整するために使用され得る。この相違は、予期されるように、一般的に非常に小さい。複数の試験について補正された単一のマーカーの関連性の有意性を評価するため、我々は、同一の遺伝子型のデータを使用したランダム化試験を行うことができる。患者のコホートおよび対照のコホートは、ランダム化されることができ、関連分析は複数回(例えば、最大500,000回)やり直すことができ、p値は、当初の患者および対照のコホートを使用して、いくつかのマーカー対立遺伝子について発明者らが観察したp値以下のp値を生じた再現の分率である。
単一のマーカーおよびハプロタイプ分析の両方について、相対リスク(RR)および集団に起因するリスク(PAR)は、複合モデル(ハプロタイプの相対リスクモデル)を仮定して算出され得る(Terwilliger J.D.およびOtt J.、Hum.Hered.42:337〜46(1992)、ならびにFalk C.T.およびRubinstein P、Ann.Hum.Genet.51(Pt3):227〜33(1987))。すなわち、ヒトが保有する2つの対立遺伝子/ハプロタイプのリスクは増加する。例えば、RRが、aに関連するAのリスクである場合、ヒトホモ接合体AAのリスクは、ヘテロ接合体AaのリスクのRR倍となり、ホモ接合体aaのリスクのRR2倍となる。複合モデルは、分析および計算を単純化する良好な性質を有する。ハプロタイプは罹患した集団内で、対照集団内同様に別個であり、すなわち、ハーディ・ワインベルグ平衡にある。結果として、罹患者および対照のハプロタイプ数は、それぞれ多項分布を有するが、別の仮説下で異なるハプロタイプの頻度を有する。特に、2つのハプロタイプ(hiおよびhj)については、リスク(hi)/リスク(hj)=(fi/pi)/(fj/pj)であり、fおよびpは、それぞれ、罹患した集団における頻度および対照集団における頻度を表す。真のモデルが増殖性ではない場合、いくらかの検出力の損失がある一方で、当該損失は、極端な症例以外では、軽度である傾向がある。最も重要なのは、帰無仮説に関して算出されるため、p値が常に妥当であることである。
1つの関連研究で検出される関連シグナルは、理想的には、同一のまたは異なる民族性の、異なる集団(例えば、同一の国の異なる領域、または異なる国)からの、第2のコホートで再現されてもよい。追試の利点は、追試で実施される試験の数であり、従って、適用される統計的基準はより厳密ではない。例えば、300,000SNPを使用した特定の疾病または形質の感受性変異体のゲノム全体での検索に対し、実施される300,000試験(各SNPについて1つ)について補正を行うことができる。典型的に使用されるアレイ上の多くのSNPは、関連しているため(すなわち、LDにあるため)、これらは独立ではない。従って、この補正は、保守的である。それにもかかわらず、この補正因子の適用は、この保守的検定(conservative test)を単一の研究コホートから得た結果に適用するとき、そのシグナルが有意であるとみなされるためには、観察されたP値が、0.05/300,000=1.7×10−7未満であることを必要とする。P値がこの保守的な閾値未満である、ゲノム全体での関連研究で見出されたシグナルは、真の遺伝効果の基準であることは明らかであり、さらなるコホートでの再現は、必ずしも統計的な観点からのものではない。しかし、当該補正因子は、実施された統計検定の数に依存するため、最初の研究から得た1つのシグナル(1つのSNP)が、第2の症例−対照コホートで再現された場合、有意性についての適切な統計検定は、1回の統計検定についてのものであり、すなわち、P値が0.05未満である。1つまたはさらにいくつかの追加の症例−対照コホートでの追試は、さらなる集団における関連シグナルの評価を与えるという付加された利点を有し、従って、最初の発見を確認し、同時にヒト集団一般で試験される遺伝的変異(1つまたは複数)の全体の有意性の評価を与える。
いくつかの症例−対照コホートから得た結果は、根底にある効果の全体の評価を与えるために合わせられてもよい。複数の遺伝関連研究から得た結果を合わせるために一般的に使用される方法論は、マンテル・ヘンツェルモデルである(MantelおよびHaenszel、J Natl Cancer Inst 22:719〜48(1959))。当該モデルは、それぞれがおそらく遺伝的変異の異なる集団頻度を有する、異なる集団から得た関連結果が合わされた状況を扱うために設計されている。当該モデルは、ORまたはRRによって判定される当該疾病のリスクに対する変異体の効果は、全ての集団で同一であるが、当該変異体の頻度が集団間で異なっているかも知れないと仮定して結果を合わせる。いくつかの集団から得た結果を合わせることは、合わせられたコホートによって与えられる、増加した統計的検出力による、現実の根底にある関連シグナルの全体の検出力が増加するという、付加された利点を有する。さらに、個体研究のいずれの欠損(例えば、症例および対照の不均等な組み合わせまたは集団の層別化による)は、複数のコホートから得た結果が合わせられると、相殺される傾向があるだろうから、ここでも再度、真の根底にある遺伝効果のより良い評価を与えるだろう。
(リスクアセスメントおよび診断)
いずれの所定の集団内でも、疾病または形質が発生する絶対的なリスクがあり、特定の期間にわたってヒトが特定の疾病または形質を生じる可能性として定義される。例えば、乳癌についての女性の生涯の絶対的なリスクは9分の1である。つまり、9人のうち1人の女性は、その人生のある時点で乳癌を生じる。典型的には、リスクは、特定の個体を見るよりも、非常に多くの人々を見ることによって判定される。リスクはしばしば絶対的なリスク(AR)および相対リスク(RR)の観点から示される。相対リスクは、2つの変異に関連するリスクまたは人々の2つの異なる群のリスクを比較するために使用される。例えば、ある遺伝子型を有する人々の群を、異なる遺伝子型を有する別の群と比較するために使用され得る。疾病について、2の相対リスクは、1つの群が他の群に対して疾病を生じる2倍の可能性を有することを意味する。示されたリスクは、通常、性別および民族性をマッチさせた集団と比較した、ヒト、またはヒトの特定の遺伝子型についての相対リスクである。同一の性別および民族性の2個体のリスクは、簡潔な様式で比較され得る。例えば、集団と比較して、第1の個体の相対リスクが1.5であり、第2の個体の相対リスクが0.5である場合、第2の個体と比較した第1の個体のリスクは、1.5/0.5=3である。
本願明細書記載のように、このようなマーカーを含むある多型マーカーおよびハプロタイプは、乳癌のリスクアセスメントに有用であることが見出された。リスクアセスメントは、乳癌に対する感受性の診断のマーカーの使用に関連し得る。多型マーカーの特定の対立遺伝子は、乳癌と診断されていない個体と比較して、乳癌を有する個体において、より頻繁であることが見出された。従って、これらのマーカー対立遺伝子は、個体において、乳癌または乳癌に対する感受性の検出の予測値を有する。リスクのあるマーカー(本発明のマーカーなど)を含むハプロタイプブロックまたはLDブロック内のタグしたマーカーは、ハプロタイプブロックまたはLDブロック内の他のマーカーおよび/またはハプロタイプの代替物として使用され得る。r2値が1に等しいマーカーは、リスクのある変異体の完全な代替物であり、すなわち、1つのマーカーの遺伝子型は、別の遺伝子型を完全に予測する。1より小さいr2値を有するマーカーはまた、リスクのある変異体の代替物となり得、あるいは、リスクのある変異体よりも高いかまたはさらに高い相対リスク値を有する変異体を表す。同定されたリスクのある変異体は、それ自体機能的変異体ではないかも知れないが、当該例では、真の機能的変異体と連鎖不平衡にある。機能的な変異体は、例えば、タンデムリピート(ミニサテライトもしくはマイクロサテライトなど)、転位因子(例えば、Alu因子)、または構造上の変化(欠損、挿入または逆位(コピー数変異、またはCNVとも呼ばれることがある)など)であってもよい。本発明は、本願明細書で開示されたマーカーのこのような代替のマーカーの評価を包含する。このようなマーカーは、当業者に周知のように、注解され、マッピングされ、および公的なデータベースに記載され、または、個体群における本発明のマーカーによって同定された領域または領域の一部の配列決定によって、代わりにすぐに同定され得、そして得られた配列群の多型性を同定する。結果として、当業者は、すぐに、かつ過度の実験をすることなく、本願明細書記載の、マーカーおよび/またはハプロタイプと連鎖不平衡の代替のマーカーの遺伝子型を同定できる。検出されたリスクのある変異体とLDにあるタグしたマーカーまたは代替のマーカーはまた、個体における乳癌、または乳癌に対する感受性の関連の検出についての予測値を有する。本発明のマーカーとLDにあるこれらのタグしたマーカーまたは代替のマーカーはまた、これらは同様に乳癌に対する感受性の検出の予測値を有するため、ハプロタイプを区別する他のマーカーを含み得る。
ある実施態様では、本発明は、乳癌に関連すると本願明細書に記載の変異体の存在についての、個体から得られたゲノムDNAを含む試料の評価によって行われ得る。このような評価は、当業者に周知の方法およびさらに本願明細書記載の方法を使用し、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在を検出する工程を含み、このような評価の成果に基づき、試料の由来である個体が、乳癌の増加したリスクまたは減少したリスク(増加した感受性または減少した感受性)にあるかを判定する。あるいは、本発明は、乳癌に関連すると本願明細書に記載の少なくとも1つの多型マーカー(または乳癌に関連すると本願明細書で示された少なくとも1つのマーカーと連鎖不平衡のマーカー)の遺伝子型の状態についての情報を含むデータセットを利用して行われ得る。換言すれば、このような遺伝的状態についての情報(例えば、ある多型マーカーまたは多数のマーカー(例えば、あるリスクのある対立遺伝子の存在または不存在の指標)における遺伝子型の数の形態にある)を含むデータセット、または1つ以上のマーカーの実際の遺伝子型は、乳癌に関連すると本願発明者によって示された、ある多型マーカーのあるリスクのある対立遺伝子の存在または不存在についてクエリーされ得る。乳癌の増加したリスクに関連する変異体(例えば、マーカー対立遺伝子)についての陽性の結果は、本願明細書で示されたように、データセットの由来である個体が乳癌の増加した感受性(増加したリスク)にあることを示す。
本発明のある実施態様では、多型マーカーは、多型マーカーの遺伝子型のデータを、多型性の少なくとも1つの対立遺伝子と乳癌との間の相関を含む検査表へ照会することによって、乳癌に関連付けられる。いくつかの実施態様では、その表は1つの多型性についての相関を含む。他の実施態様では、表は多数の多型性についての相関を含む。両方のシナリオで、マーカーと乳癌との間の相関の指標を与える検査表へ照会することによって、乳癌のリスク、または乳癌に対する感受性が試料の由来である個体において同定され得る。いくつかの実施態様では、相関は統計的測定として報告される。統計的測定はリスクの測定(相対リスク(RR)、絶対的なリスク(AR)またはオッズ比(OR)など)として報告されてもよい。
本発明のマーカーおよびハプロタイプ(例えば、染色体5p12および染色体10q26上の多型マーカー、例えば、表12、13および14に示されたマーカー、例えば、マーカーrs7703618、rs4415084、rs2067980、rs10035564、rs11743392、rs7716600、rs10941679、rs1219648)は、単独または併用のいずれかで、リスクアセスメントおよび診断の目的について有用であり得る。従って、個体マーカーによるリスクの増加が相対的に中程度、すなわち約10〜30%である症例においてさえも、その関連は重要な意味を有するかも知れない。従って、相対的に一般的な変異は、全体のリスクに対して有意な寄与を有してもよく(集団に起因するリスクが高い)、またはマーカーの組み合わせは、マーカーの複合リスクに基づき、疾病の発生の有意な複合リスクを有する個体群の定義に使用され得る。
例えば、合わせたリスクは、染色体5p12および染色体10q26上のマーカー(マーカーrs10941679およびマーカーrs1219648など)についての遺伝子型の結果に基づいて評価され得る。あるいは、これらのマーカーのいずれかとLDにあるマーカーは、評価され得る。乳癌のリスクを与えることが知られる他のマーカーもまた、本願明細書に記載されたマーカー(染色体2q14上のマーカー(例えば、マーカーrs4848543またはそれと連鎖不平衡のマーカー)、2q35上のマーカー(例えば、マーカーrs13387042、またはそれと連鎖不平衡のマーカー)、および染色体16上のマーカー(例えば、マーカーrs3803662、またはそれと連鎖不平衡のマーカー)など)とともに評価され得る。
従って、本発明の1つの実施態様では、複数の変異体(マーカーおよび/またはハプロタイプ)は、全体のリスクアセスメントのために用いられる。これらの変異体は、1つの実施態様では、本願明細書に開示された変異体から選択される。他の実施態様は、乳癌に対する感受性の診断に有用であることが知られた他の変異体と組み合わせた本発明の変異体の使用を含む。いずれの2つ以上のマーカーについての結果(3つのマーカー、4つのマーカー、5つのマーカー、6つのマーカー、7つのマーカー、8つのマーカー、9つのマーカー、または10以上のマーカーについての結果など)は、このような分析で合わせられることができる。このような実施態様では、多数のマーカーおよび/またはハプロタイプの遺伝子型の状態は、関連した変異体の集団における頻度、または臨床的に健康な被験者(年齢をマッチさせた被験者および性別をマッチさせた被験者など)の変異体の頻度と比較した、個体、および個体の状態について判定される。当該技術分野で公知の方法(多変量解析または共同リスク解析など)は、その後に、複数の部位の遺伝子型の状態に基づいて与えられた全体のリスクの判定のために使用されてもよい。このような分析に基づくリスクの評価は、本願明細書記載のように、その後に、本発明の方法およびキットで使用されてもよい。
上述のように、ヒトゲノムのハプロタイプブロックの構造は、疾病または形質と元来関連した変異体と連鎖不平衡にある数多くの変異体(マーカーおよび/またはハプロタイプ)は、疾病または形質に対する関連の評価のための代替のマーカーとして使用されてもよいという効果を有する。このような代替のマーカーの数は、因子(領域内の背景の組み換え率、領域内の変異の頻度(すなわち、領域内の多形性部位またはマーカーの数)、および領域内のLDの程度(LDブロックのサイズ)など)に依存するだろう。これらのマーカーは、通常、本願明細書記載の方法または他の当業者に知られた方法を使用して定義されるように、問題となっているLDブロックまたはハプロタイプブロックの物理的な境界内に位置する。しかし、時折、マーカーおよびハプロタイプの関連は、定義されたハプロタイプブロックの物理的な境界を越えて拡張することが見出された。このようなマーカーおよび/またはハプロタイプはまた、これらの症例において、定義されたハプロタイプブロック内に物理的に属するマーカーおよび/またはハプロタイプの代替のマーカーおよび/またはハプロタイプとして使用されてもよい。結果として、本発明のマーカーおよびハプロタイプとLDにあるマーカーおよびハプロタイプ(典型的には、0.1より大きいr2によって特徴付けられ、0.2より大きいr2など、0.3より大きいr2を含み、0.4より大きいr2をまた含む)はまた、これらが定義されたハプロタイプブロックの境界を越えて物理的に位置している場合であっても、本発明の範囲内である。これは、本願明細書記載のマーカー(例えば、表1および表3、例えば、rs4415084、rs10941679、rs1219648)を含むがまた、1つ以上の表1および表3に記載されたマーカーと強いLD(例えば、0.1または0.2より大きいr2、および/または|D’|>0.8によって特徴付けられる)にある他のマーカーを含んでいてもよい。
本願明細書記載のSNPマーカーについて、患者において過剰であることが見出された対立遺伝子(リスクのある対立遺伝子)に対して逆の対立遺伝子は、乳癌において頻度が減少していることが見出された。このようなマーカーとLDにあり、かつ/またはこのようなマーカーを含む、これらのマーカーおよびハプロタイプは、従って、乳癌に対して保護的であり、すなわち、これらは、乳癌を発生させるこれらのマーカーおよび/またはハプロタイプを保有する個体において減少したリスクまたは感受性を与える。
あるハプロタイプを含めて、本発明のある変異体は、いくつかの症例では、様々な遺伝子マーカーの組み合わせ、例えば、SNPおよびマイクロサテライトを含む。ハプロタイプの検出は、多形性部位の配列の検出のための当該技術分野で公知の方法および/または本願明細書記載の方法によって達成され得る。さらに、あるハプロタイプまたはマーカーのセットと、疾病の表現型との間の相関は、標準的な技術を使用して検証され得る。相関についての簡易試験の代表的な例は、2×2の表のフィッシャーの直接確率検定であるだろう。
特定の実施態様では、乳癌に関連することが見出されたマーカー対立遺伝子またはハプロタイプ(例えば、表1および表3に記載されたマーカー対立遺伝子、表12、13および14に記載されたマーカー(配列番号1〜237))は、マーカー対立遺伝子またはハプロタイプが、健康な個体(対照)におけるその存在の頻度と比較して、乳癌のリスクのある(罹患した)個体により頻繁に存在するものであり、当該マーカー対立遺伝子またはハプロタイプの存在は、乳癌または乳癌に対する感受性を示す。他の実施態様では、乳癌に関連することが見出された1つ以上のマーカーと連鎖不平衡のリスクのあるマーカーは、健康な個体(対照)におけるその存在の頻度と比較して、乳癌のリスクのある(罹患した)個体により頻繁に存在するタグしたマーカーであり、当該タグしたマーカーの存在は、乳癌に対する増加した感受性を示す。さらなる実施態様では、乳癌に関連することが見出された1つ以上のマーカーと連鎖不平衡の、リスクのあるマーカー対立遺伝子(すなわち、増加した感受性を与える)は、健康な個体(対照)におけるその存在の頻度と比較して、乳癌のリスクのある個体により頻繁に存在する1つ以上の対立遺伝子を含むマーカーであり、当該マーカーの存在は乳癌に対する増加した感受性を示す。
(集団の研究)
一般的な意味では、本発明の方法およびキットは、いずれの供給源(すなわちいずれの個体)からのゲノムDNAを含む試料を利用し得る。好ましい実施態様では、個体はヒト個体である。当該個体は、成人、子供、または胎児であり得る。本発明はまた、標的集団のメンバーである個体のマーカーおよび/またはハプロタイプの評価について提供する。このような標的集団は、1つの実施態様では、他の遺伝要因、バイオマーカー、生物物理的なパラメータ(例えば、体重、BMD、血圧)、または一般的な健康および/または生活習慣のパラメータ(例えば、癌の履歴、乳癌の履歴、疾病の以前の診断、疾病の家族歴、乳癌の家族歴)に基づく、疾病を発生させるリスクがある個体の集団または群である。
本発明は、特定の年齢亜群(40歳超、45歳超、または50、55、60、65、70、75、80、または85歳超など)からの個体を含む実施態様を提供する。本発明の他の実施態様は、他の年齢群(85歳未満の個体など、80歳未満、75歳未満、または70、65、60、55、50、45、40、35、または30歳未満など)に関する。他の実施態様は、疾病の発生時の年齢が上述の年齢幅のいずれかである個体に関する。年齢幅は、ある実施態様では、発生時の年齢が45歳超だが60歳未満などであることに関連していてもよいことも考慮される。しかし、他の年齢幅もまた考慮され、上記の年齢の値によってひとまとめにされる全ての年齢幅を含む。本発明は、さらに、いずれかの性別(男性または女性)の個体に関する。いくつかの実施態様では、男性の被験者の評価に関する。好ましい実施態様では、女性の被験者の評価に関する。
アイスランド人の集団は、北欧の系統のコーカサス人の集団である。アイスランド人の集団の遺伝的連鎖および関連の結果を報告する数多くの研究が、直近の数年間に発表されてきている。これらの研究の多くは、特定の疾病に関連しているとしてアイスランド人の集団で最初に同定された変異の再現を、他の集団でも示した(Styrkarsdottir、U.、ら N Engl J Med 2008年4月29日(印刷物に先駆けた電子出版);Thorgeirsson、T.ら Nature 452:638〜42(2008);Gudmundsson、J.ら Nat Genet.40:281〜3(2008);Stacey、S. N.ら、Nat Genet.39:865〜69(2007);Helgadottir、A.ら、Science 316:1491〜93(2007);Steinthorsdottir、V.ら、Nat Genet.39:770〜75(2007);Gudmundsson、J.ら、Nat Genet.39:631〜37(2007);Frayling、TM、Nature Reviews Genet 8:657〜662(2007);Amundadottir、LT.ら、Nat Genet.38:652〜58(2006);Grant、S.F.ら、Nat Genet.38:320〜23(2006))。従って、アイスランド人の集団における遺伝的発見は、一般的に、他の集団(アフリカ人の集団およびアジア人の集団を含む)において再現されている。
乳癌に関連することが見出された本発明のマーカーは、他のヒト集団において同様の関連性を示すと考えられている。従って、ヒト個体集団を含む特定の実施態様もまた考慮され、本発明の範囲内である。このような実施態様は、コーカサス人の集団、ヨーロッパ人の集団、アメリカ人の集団、ユーラシア人の集団、アジア人の集団、中央/南アジア人の集団、東アジア人の集団、中東人の集団、アフリカ人の集団、スペイン系アメリカ人の集団、およびオセアニア人の集団を含む(しかしこれらに限定されない)1つ以上のヒト集団の出身であるヒト被験者に関する。ヨーロッパ人の集団は、スウェーデン人、ノルウェー人、フィンランド人、ロシア人、デンマーク人、アイスランド人、アイルランド人、ケルト人、英国人、スコットランド人、オランダ人、ベルギー人、フランス人、ドイツ人、スペイン人、ポルトガル人、イタリア人、ポーランド人、ブルガリア人、スラブ人、セルビア人、ボスニア人、チェコ人、ギリシャ人およびトルコ人集団を含むが、これらに限定されない。さらに、本発明の他の実施態様では、バンツー人、マンデンク(Mandenk)人、ヨルバ族、サン(San)人、ムブティピグミー(Mbuti Pygmy)族、オークニー諸島民、アディゲル(Adygel)人、ロシア人、サルデーニャ人、トスカナ人、モザバイト(Mozabite)人、ベドウィン、ドゥルーズ(Druze)人、パレスチナ人、バロチ(Balochi)人、ブラーフーイ人、マクラーニー(Makrani)人、シンド族、パサン族、ブルショー(Burusho)族、ハザラ人、ウィグル人、カラシュ(Kalash)族、ハン族、ダイ族、ダフール族、ホジェン(Hezhen)族、ラフ族、ミャオ族、オロチョン(Oroqen)族、シー(She)族、トゥチャ(Tujia)族、トゥ(Tu)族、シボ(Xibo)族、イ族、モンゴル(Mongolan)人、ナシ(Naxi)族、カンボジア人、日本人、ヤクート族、メラネシア人、パプア人、カーチアン(Karitianan)人、スルイ(Surui)人、コロンビア(Colmbian)人、マヤ人およびピマ族、を含む、特定のヒト集団において行われ得る。
ある実施態様では、本発明は、黒色アフリカ人の系統(アフリカ人の家系または系統のヒトを含む集団など)を含む集団に関する。黒色アフリカ人の系統は、アフリカ系アメリカ人(African−Americans)、アフリカ系アメリカ人(Afro−Americans)、黒色アメリカ人、黒色人種の一員、または黒人人種の一員であるという自己申告によって判定されてもよい。例えば、アフリカ系アメリカ人または黒色アメリカ人は、南アフリカに住んでおり、かつアフリカの黒色人種の群のいずれかに起源を有するヒトである。別の例は、黒色アフリカ人系統について自己申告したヒトは、少なくとも1人の黒色アフリカ人の系統の両親または少なくとも1人の黒色アフリカ人の系統の祖父母を有していてもよい。
個々の被験者における人種の寄与はまた、遺伝的分析によって判定されてもよい。系統の遺伝的分析は、非連鎖のマイクロサテライトマーカー(Smithら、Am J Hum Genet 74、1001〜13(2004)に提示されるものなど)を使用して行ってもよい。
ある実施態様では、本発明は、上述のように、特定の集団で同定されたマーカーおよび/またはハプロタイプに関する。当業者は、連鎖不平衡(LD)の判定は、異なる集団に適用した場合は異なる結果を与えてもよいことを理解するだろう。このことは、特定のゲノム領域におけるLDの相違を引き起こしたかも知れない、異なるヒト集団の異なる集団歴および異なる選択圧による。あるマーカー(例えば、SNPマーカー)は、1つの集団では多型だが、別の集団ではそうではないこともまた、当業者に周知である。しかし、当業者は、いずれかの所定のヒト集団で本発明を実行するために、利用可能であり、本願明細書で教示された方法を適用するだろう。このことは、特定の集団内で最も強い関連を与えるこれらのマーカーを同定するための、本発明のLD領域における多型マーカーの評価を含んでいてもよい。従って、本発明のリスクのある変異体は、異なるハプロタイプの背景に、および様々なヒト集団において異なる頻度で属していてもよい。しかし、当該技術分野で公知の方法および本発明のマーカーを利用し、本発明は、所定のヒト集団いずれにおいても実行され得る。
(乳癌の遺伝するリスクを予測するモデル)
乳癌のリスクアセスメントの目的は、全ての女性に対して、高いリスクの女性においては生存期間および生活の質の増加のため、一方、低いリスクの女性においては費用、不要な介入および不安の最小化のための、個別化された医学的管理戦略の開発の合理的なフレームワークを提供することである。リスク予測モデルは、先天性リスク特性の所定のセット(例えば、家族歴、術前良性乳房病変、以前の乳腺腫瘍)を有する個体の乳癌のリスクを推定しようと試みる。診療において最も一般的に使用される乳癌のリスクアセスメントモデルは、家族歴を考慮して、遺伝する危険因子を評価する。リスク評価は、以前に乳癌と診断された1つ以上の近親者を有する個体の増加したリスクの観察に基づく。これらは、複雑な系統構造を考慮しない。これらのモデルは、乳癌になりやすい変異を有する遺伝子の保有者と非保有者とを区別できないというさらなる不利益を有する。
さらに洗練されたリスクモデルは、特定の家族歴を扱うためのより良い機構を有し、BRCA1変異およびBRCA2変異のキャリア状態を考慮する能力を有する。例えば、疾病発生率についての乳房分析および卵巣分析ならびに保有者推定アルゴリズム(BOADICEA)(Antoniouら、2004)は、系統分析プログラムMENDELによる個体系統構造に基づく家族歴を考慮している。公知のBRCA1およびBRCA2の状態に関する情報もまた、考慮される。現在使用されているBOADICEAおよび全ての他の乳癌のリスクモデルの主な制限は、これらは他の素因遺伝子からの遺伝子型の情報を、取り込まないことである。現在のモデルは、リスクの非BRCA遺伝的決定要因についての知識の欠如を補うための代替物として作用する、家族歴に強く依存している。従って、利用可能なモデルは、疾病の家族歴が分かっている状況に制限される。より低い浸透率の乳癌素因遺伝子は、集団において相対的に一般的であるかも知れず、BRCA1およびBRCA2遺伝子のようには、家族性クラスター形成を促進するこのような強い傾向を示さないかも知れない。素因対立遺伝子について相対的に高い遺伝的負荷を有する患者は、ほとんど、または全く疾病の家族歴を示さないかも知れない。従って、遺伝子に基づいた試験を通じて、直接的に得られた遺伝する感受性データを取り込むモデルの構築についてニーズがある。モデルをより正確にすることに加えて、これは、家族歴パラメータへの依存性を減少させ、リスク特性を家族歴がそれほど鍵因子とならない、より幅広いリスクのある集団へ拡張することを支援するだろう。
(改善された遺伝的危険率モデルの乳癌一次予防の臨床的管理への統合)
臨床的一次予防の選択肢は、現在、化学予防(またはホルモン)治療および予防的手術に分類され得る。高いリスクと同定される患者は、長期コースの化学予防的治療を処方され得る。この構想は、循環器学の分野で広く受け入れられているが、臨床的腫瘍学では、今ようやく、影響を与え始めている。最も広く使用されている腫瘍学の化学予防は、タモキシフェン(選択的エストロゲン受容体調節物質(SERM))である。乳癌再発に対して向けられたアジュバント治療方法として最初に使用され、タモキシフェンは今、乳癌の予防的薬剤としての有効性が証明されている(Cuzickら、(2003)、Lancet、361、296〜300)(Martinoら、(2004)、Oncologist、9、116〜25)。FDAは、ある高いリスクの女性の化学予防薬剤として、タモキシフェンの使用を承認した。
残念ながら、長期間のタモキシフェンの使用は、子宮内膜癌のリスクを約2.5倍増加させ、静脈血栓症のリスクを約2.0倍増加させる。肺塞栓症、脳卒中、および白内障のリスクもまた、増加する(Cuzickら、(2003)、Lancet、361、296〜300)。従って、乳癌発生率を減少させるタモキシフェン使用の利益は、全体的な死亡率における対応する減少に簡単に解釈されないかも知れない。ラロキシフェンと呼ばれる別のSERMは、予防的方法においてより効果的であるかも知れず、子宮内膜の癌についての同様のリスクはもたらさない。しかし、血栓症のリスクは、ラロキシフェンで長期間治療された患者において、依然として上昇する(Cuzickら、(2003)、Lancet、361、296〜300;Martinoら、(2004)、Oncologist、9、116〜25)。さらに、タモキシフェンおよびラロキシフェンの両方が、それらに関連する生活の質の問題点を有する。化学予防的方法におけるSERM治療方法の合理的なリスク:利益分析を行うために、最も乳癌のリスクのある個体の同定について臨床的なニーズがある。実質的に一部の乳癌のリスクが遺伝的であるとすると、当該状況での個体のリスクを定量化するための遺伝的試験について明確な臨床的ニーズがある。利用可能になるかも知れない将来の癌の化学予防的治療(アロマターゼ阻害剤など)のいずれかから生じる同様の問題点について予測し得る。さらに、化学予防的治療が安全になるにつれ、遺伝的な傾向があるが、BRCA1および2の保有者に関連する、大量の上昇したリスクは有さない患者を同定するニーズが増加する。
乳癌について高いリスクを有すると同定された患者は、予防的手術(両側乳房切除術もしくは卵巣摘出術のいずれか、または両方)について考慮される。明らかにこのように強烈な治療は、極度に高いリスクが認知された患者に対してのみ推奨される。実際に、このようなリスクは、現在、BRCA1、BRCA2または、まれな乳癌素因の症候群に関連することが知られる遺伝子(リー・フラウメニ症候群におけるp53、カウデン症候群におけるPTENなど)の変異を有する個体のみ同定され得る。
BRCA1変異およびBRCA2変異の浸透率の評価は、集団に基づいた推定に由来している場合に比べて、複数の症例の家族に由来している場合に高い傾向にある。これは、異なる変異を有する家族は、乳癌に対して異なる浸透率を呈するからである(例えば、(Thorlaciusら、(1997)、Am J Hum Genet、60、1079〜84)参照)。当該変異に寄与する主な因子の1つは、BRCA1変異およびBRCA2変異の浸透率を修飾する効果を有する、今までのところ未知の素因遺伝子の作用である。従って、BRCA1またはBRCA2遺伝子の変異を有する個体の絶対的なリスクは、修飾遺伝子の存在および作用についての知識がない場合では、正確に数量化されない。BRCA1およびBRCA2保有者の治療上の選択肢は、苛酷であり得るため、当該状況では、それぞれのBRCA保有者のリスクについて、できるだけ最大の正確性で定量化することが重要である。従って、BRCA1およびBRCA2保有者の乳癌の浸透率を修飾する効果を有する素因遺伝子を同定し、およびこれらの遺伝子に基づく改善されたリスクアセスメントモデルの開発についてニーズがある。
さらに、恐らく強い乳癌の家族歴が原因である、乳癌について非常に高いリスクが認知された個体がいるが、そのような個体においては、公知の素因遺伝子の変異は同定され得ない。高い浸透率の素因遺伝子を受け継いでいるかどうかを発見するために個体を試験することはできないため、このような症例において予防的手術の考慮は困難である。従って、個体のリスクは、正確に評価され得ない。従って、発見されていないままのいずれかの高い浸透率の素因遺伝子の同定、および一次予防戦略で使用するための関連する遺伝的試験の開発について、明確な臨床的ニーズがある。このような遺伝子は、例えば、乳癌のリスクと関連があると本願明細書で開示された遺伝子(例えば、FGF10、MRPS30および/またはFGFR2遺伝子)であってもよい。乳癌のリスクと関連があると本願明細書で示された変異体は極めて一般的であり、相対的に低い乳癌のリスクを与えるが、より高いリスク変異体が1つ以上のこれらの遺伝子の中に存在する可能性が十分にある。従って、FGF10、MRPS30および/またはFGFR2遺伝子のうちの1つ以上の中の、またはこれらと関連する高いリスクの遺伝的変異は、個体が乳癌について高いリスクの(かつ高い浸透率の)遺伝要因の保有者であるかどうかを判定するのに有用であり得ると考えられる。
(早期診断)
大部分の西洋諸国における乳癌の臨床的スクリーニングは、定期的な臨床的な乳房の診察(CBE)およびX線マンモグラフィーからなる。CBEが、良好な乳房X線撮影によるスクリーニングプログラムに関連して使用されても、ほとんど利益が付加されないことを示す優れたエビデンスがある。イギリスでは、50〜70歳の女性は、3年ごとにスクリーニングマンモグラフィーを受けるように勧められる。米国における状況は医療提供者によって異なるが、しかし、アメリカ癌協会は、40歳からは年1回の乳房X線撮影によるスクリーニングを推奨している。乳房X線撮影によるスクリーニングは、50歳を超えたスクリーニングされた女性の間の死亡率の減少について証明された有効性を有する。
遺伝子検査が、既存の乳房X線撮影によるスクリーニングプログラムへのアクセスを減少させる手段として採用されることは、絶対にありそうにない。しかし、乳房X線撮影によるスクリーニングは、欠点がないわけではなく、遺伝子検査は、増強されたスクリーニングプログラムのための人々を選別するのに使用されるべきであると考えられる。乳房X線撮影によるスクリーニングの弱点の1つは、これまでは、50歳未満のスクリーニングされた女性の改善された生存について、著しい効果を示す可能性がないことである。
マンモグラフィーが50歳未満の女性において効果が少ない1つの理由は、乳房組織の密度は、より若い女性において高く、腫瘍の乳房X線撮影の検出をより困難にしていることかも知れない。しかし、遺伝的な傾向がある個体の乳癌は、若年齢群で生じる傾向があり、高い乳房密度と乳癌のリスクとの間の明確な関連がある。従って、最も高いリスク群において最適でなく行われる技術によって管理され得るため、高い素因を有する個体の乳房X線撮影によるスクリーニングの単純な増加に問題がある。近年の研究では、乳房X線撮影によるスクリーニングよりも、造影磁気共鳴画像(CE−MRI)が、当該高いリスク群において、より感度が高く、より早期の段階で腫瘍を検出することが示された(Warnerら、(2004)、Jama、292、1317〜25;Leachら、(2005)、Lancet、365、1769〜78)。CE−MRI戦略は、特に、ルーチンX線マンモグラフィーと組み合わせて使用される場合に、よく役立つ(Leachら、(2005)、Lancet、365、1769〜78)。CE−MRIは、高い費用がかかる専門家のセンターを必要とするため、50歳未満のスクリーニングは、最も高いリスクを有する個体に制限されなければならない。現在のCE−MRI試験は、BRCA1、BRCA2もしくはp53変異ならびに疾病の非常に強い家族歴を有する個体のエントリーを制限している。
当該スクリーニング様式をより幅広い範囲の高いリスクの患者に拡張することは、遺伝子に基づいたリスクプロファイリングの手段の供給によって、大いに補助される。
早期発生の乳癌および遺伝的に傾向がある女性に生じる癌は、より高齢の、遺伝的な傾向が強くない女性の癌よりも増殖が早いという概念を支持する優れたエビデンスがある。これは、より若い女性における高率の中間期癌の観察に由来し、つまり、よくスクリーニングされた集団においてスクリーニング来診間の間隔で生じた癌は、より若い女性の間で高い。従って、スクリーニング間隔は、どんな方法によるものであれ、より若い女性については減少されるべきであることの示唆がある。ここに、より高価な方法論を用いたより頻繁なスクリーニングは、乳癌の全体的な割合が比較的低い年齢群に対して必要とされると思われるという逆説がある。ここに、早期の疾病を生じる最も強い遺伝的な傾向がある若い個体を同定し、彼らをより高価かつ広範なスクリーニング管理に導く、明確な臨床的ニーズがある。乳癌のリスクを与えると本願明細書で開示された変異体は、乳癌の発生について特に高いリスクにある個体の同定に有用であり得る。このような個体は、癌の早期の同定の尤度を最大にするための、初期の、かつ活発なスクリーニング計画からの恩恵を最も得られる可能性がある。
(治療)
現在、原発性乳癌は、手術、アジュバント化学療法、放射線療法、その後の長期間のホルモン療法によって治療される。しばしば、3つまたは4つの治療の組み合わせが使用される。
疾病の同様の段階の乳癌患者は、全体的な治療成果における広い変異をもたらす、アジュバント化学療法に対する非常に異なる反応を有し得る。総合指針(ザンクトガレン(St Galen)およびNIHの判断基準)が、アジュバント化学療法の治療に対する乳癌患者の適格性を決定するために開発された。しかし、転移の最も強い臨床的前兆および組織学的前兆さえも、正確に乳腺腫瘍の臨床的反応を予測するには至っていない(Goldhirschら、(1998)、J Natl Cancer Inst、90、1601〜8;Eifelら、(2001)、J Natl Cancer Inst、93、979〜89)。化学療法またはホルモン療法は、転移のリスクを約1/3しか減少させないが、しかし、70〜80%の当該治療を受けている患者は、それなくして生存している。従って、大部分の乳癌患者は、現在、無効または不要な治療のいずれかを提供されている。臨床医が、最善の利益を受ける者に対して治療をより適切に調整することができる予後診断の基準の開発の改善について、明確な臨床的ニーズがある。遺伝的素因についての個体の鑑定は、彼らの治療成果に関連する情報を明らかにし、それによって合理的な治療計画を助けるかも知れないと予期するのは合理的である。乳癌のリスクを与える本発明のマーカーは、この状況において有用であると考えられる。
いくつかの以前の研究は、当該概念を例証する。BRCA変異保有者の乳癌患者は、アジュバント化学治療で治療された場合、より良い臨床的反応の割合および生存を示すことが明らかとなった(Chappuisら、(2002)、J Med Genet、39、608〜10;Goffinら、(2003)、Cancer、97、527〜36)。BRCA変異保有者は、卵巣癌の白金化学療法に対して、非保有者よりも、改善された反応を示した(Cassら、(2003)、Cancer、97、2187〜95)。同様の考察は、関連する遺伝子が未知である遺伝的な傾向がある患者に対しても当てはまるかも知れない。例えば、浸潤性小葉乳癌(ILBC)は、強い家族性要素を有することが知られるが、関連する遺伝的変異は未だ同定されていない。ILBCを有する患者は、一般的な化学療法管理に対して乏しい反応を示す(Mathieuら、(2004)、Eur J Cancer、40、342〜51)。
遺伝的素因モデルは、治療戦略の個別化を補助するだけでなく、これらの戦略の設計において不可欠な役割を果たすかも知れない。例えば、BRCA1およびBRCA2変異の腫瘍細胞は、ポリ(ADPリボース)ポリメラーゼ(PARP)阻害剤に対し、その欠損したDNA修復経路の結果、深刻な感受性があることが見出された(Farmerら、(2005)、Nature、434、917〜21)。これは、BRCA保有者である患者特異的な使用を目的とした、PARPを標的にした小分子薬剤の開発を刺激した。この例から、遺伝的素因の知識が、遺伝的危険率特性と組み合わせて使用される個別化された化学療法管理の開発を導く薬剤標的を同定するかも知れないことは明らかである。同様に、本発明のマーカーは、例えば、FGF10、MRPS30および/またはFGFR2遺伝子のうち1つ以上を標的にする新規な薬物の同定の助けになるかも知れない。
癌化学療法は、周知の、通常の組織(特に、高増殖性ヘモポエティック(hemopoetic)細胞区画および腸上皮細胞区画)に対する用量制限副作用を有する。遺伝に基づいた個体差が、細胞障害性薬剤に対する通常の組織の感受性に存在することが予測され得る。これらの因子についての理解は、合理的な治療計画および通常の組織を化学療法の副作用から保護するように設計された薬剤開発を助けるかも知れない。
遺伝的特性はまた、改善された放射線療法のアプローチに寄与するかも知れない。標準的な放射線療法管理を受けている乳癌患者群内で、患者の一部は、通常は許容的な放射線量に対する有害反応を経験するだろう。急性反応は、紅斑、湿性落屑、浮腫および放射線気腫(radiation pneumatitis)を含む。毛細血管拡張症、浮腫、肺線維症および乳腺線維症を含む、長期間の反応は、放射線療法後何年も生じるかも知れない。急性反応および長期間の反応は両方とも罹患率の大きな原因であり、致死的であり得る。1つの研究では、11%は深刻な有害反応を有する一方で、87%の患者は、放射線療法に対するいくつかの有害な副作用を有することが見出された(LENT/SOMA 段階3〜4)(Hoellerら、(2003)、Int J Radiat Oncol Biol Phys、55、1013〜8)。放射線療法に対する有害反応を経験する可能性は、主に通常の組織反応における恒常的な個体差によるものであり、これらは強い遺伝的要素を有するという疑いがある。いくつかの公知の乳癌素因遺伝子(例えば、BRCA1、BRCA2、ATM)は、DNA二本鎖の切断修復経路に影響する。DNA二本鎖の切断は、放射線療法によって引き起こされた原発性細胞障害性の障害である。これは、これらの経路に属する遺伝子の変異を有することを通じて乳癌に遺伝的な傾向がある個体はまた、放射線療法から過剰な通常組織の障害を受ける高いリスクを有するかも知れないという懸念を導く。例えば、FGF10、MRPS30および/またはFGFR2遺伝子のうち1つ以上を通じて乳癌のリスクを与えると本願明細書に記載された遺伝的変異体は、放射線療法に対する有害反応という特定のリスクを有する個体の同定に有用であるかも知れないと考えられる。
集団における恒常的に放射線感受性な個体の存在は、有害反応の頻度を容認できるレベルに維持するため、大部分の患者集団に対する放射線療法の線量率は制限されなければならないことを意味する。従って、放射線療法に対する有害反応に対する上昇したリスクを有する個体を同定できる信頼できる試験について臨床的ニーズがある。このような試験は、相対的に放射線抵抗性な大部分の患者に対する放射線治療量の増大を許容する一方で、放射線感受性の個体に対する保守的なまたは別の治療を示すだろう。用量の増大は、乳癌患者を単純に放射線感受性分類、中間分類および放射線抵抗性分類へトリアージ方式に分類するための試験によって可能となり、これは、局所的な腫瘍管理について約35%の増加、および結果的な生存率の改善をもたらし得ることが推定される(Burnetら、(1996)、Clin Oncol(R Coll Radiol)、8、25〜34)。
電離放射線への曝露は、乳房における発癌に寄与する証明された因子である。(Dumitrescu and Cotarla、(2005)、J Cell MoI Med、9、208〜21)。公知の乳癌素因遺伝子は、放射線誘発のDNA損傷に対する細胞応答の経路の要素をコードする(NarodおよびFoulkes、(2004)、Nat Rev Cancer、4、665〜76)。従って、続発性原発性乳腺腫瘍のリスクが、放射線療法の領域内で通常の組織に対する照射によって増加するかも知れないという懸念がある。放射線療法によるBRCA保有者についてのいずれの判定可能な増加したリスク明らかではないが、しかし、続発性原発腫瘍についてのそのリスクは、すでに例外的に高い。続発性原発腫瘍のリスクは、放射線療法で治療された、ATMおよびCHEK2遺伝子における乳癌になりやすい対立遺伝子の保有者で増加することを示唆するエビデンスがある(Bernsteinら、(2004)、Breast Cancer Res、6、R199〜214;Broeksら、(2004)、Breast Cancer Res Treat、83、91〜3)。放射線療法による(および、恐らく、集中的な乳房X線撮影によるスクリーニングによる)による続発性原発腫瘍のリスクは、治療計画段階に間の患者の正確な遺伝的危険率特性を得ることによって、より良く定められるだろうことが予期される。
(再発予防)
ステージ1または2の乳癌と診断された患者の約30%は、それらの原発腫瘍の局所領域転移性再発または遠隔転移性再発のいずれかを経験するだろう。
原発性乳癌を有していた患者はまた、乳房保存手術が行われた場合、対側乳房または同側乳房において、続発性原発腫瘍と診断される非常に増加したリスクを有する。再発予防は、再発予防または続発性原発腫瘍の発生の予防に使用される方法を意味する。現在使用される方法は、以下を含む。タモキシフェンもしくは別のSERM(単独またはアロマターゼ阻害剤と交互)による長期間の治療、リスクを減少する対側乳房の乳房切除術、ならびにリスクを減少する卵巣摘出術(家族性乳房癌および卵巣癌のリスクを有する患者)。タモキシフェンの使用に関する考察は上記で議論されている。リスクを減少する外科的選択肢について、できるだけ費用:利益分析を知らせるために、リスクが数量化される必要があることは明らかである。
乳癌についての公知の遺伝的素因を有する患者が、大部分の患者よりも悪化したことについていくつかの指標がある。CHEK2遺伝子1100delC変異を有する患者は、非保有者と比較して、推定2.8倍の遠隔転移についての増加したリスク、3.9倍の疾病再発の増加したリスクを有する(de Bockら、(2004)、J Med Genet、41、731〜5)。BRCA1リンパ節転移陰性の腫瘍を有する患者は、BRCA1変異を有さない同様の患者よりも、転移についてより大きなリスクを有する(Goffinら、(2003)、Cancer、97、527〜36;Mollerら、(2002)、Int J Cancer、101、555〜9;Eerolaら、(2001)、Int J Cancer、93、368〜72)。従って、遺伝的特性は、局所的な再発および転移のリスクを評価するのを助けるために使用され得、それによって二次予防的な治療の選択を導く。本願明細書で記載された変異体に基づく遺伝的プロファイリングは、この状況において有用であるかも知れない。ある実施態様では、このようなプロファイリングは、本願明細書で記載された1つ以上の変異体に基づいていてもよい。他の実施態様では、このようなプロファイリングは、1つまたはいくつかの他の既知の、乳癌の遺伝的危険因子を含んでいてもよい。このような危険因子は、確立した高い浸透性の危険因子であってもよく、または、これらは前述の、1つ以上の、一般的な、より低い浸透率危険因子(例えば、染色体2q14上のマーカー(例えば、マーカーrs4848543またはそれと連鎖不平衡のマーカー)、2q35上のマーカー(例えば、マーカーrs13387042、またはそれと連鎖不平衡のマーカー)、染色体16上のマーカー(例えば、マーカーrs3803662、またはそれと連鎖不平衡のマーカー)であってもよい。
通常は、原発性腫瘍と診断された患者は、一定の年間発生率(0.7%)の続発性原発腫瘍のリスクを有する(PetoおよびMack、(2000)、Nat Genet、26、411〜4)。BRCA変異を有する患者は、大部分の乳癌患者よりも、40〜60%の範囲の絶対的なリスクで、続発性原発腫瘍について著しく大きいリスクを有する(Easton、1999、Breast Cancer Res、1、14〜7)。BRCA変異の保有者は、続発性原発腫瘍の非常に増加したリスクを有する(Staceyら、(2006)、PLoS Med、3、e217;Metcalfeら、(2004)、J Clin Oncol、22、2328〜35)。CHEK2遺伝子変異の患者は、対側乳癌について、推定5.7倍の増加したリスクを有する(de Bockら、(2004)、J Med Genet、41、731〜5)。BARD1 Cys557Ser変異の保有者は、続発性原発腫瘍と診断される傾向が2.7倍である(Staceyら、(2006)、PLoS Med、3、e217)。遺伝的危険率の特性は、患者における続発性原発腫瘍のリスクを評価するのに使用され得、予防措置がどの位激しいものであるべきかについての決定を知らせるだろう。
(本発明の方法)
(診断アッセイおよびスクリーニングアッセイ)
ある実施態様では、本発明は、乳癌の被験者もしくは乳癌に感受性がある被験者においてより頻繁に表れる遺伝子マーカーの特定の対立遺伝子を検出することよる、乳癌もしくは乳癌に対する感受性の診断方法、または診断の補助方法に関する。特定の実施態様では、本発明は、少なくとも1つの多型マーカー(例えば、本願明細書記載のマーカー)の少なくとも1つの対立遺伝子を検出することによる、乳癌に対する感受性の判定方法である。他の実施態様では、本発明は、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子を検出することによる、乳癌に対する感受性の診断方法に関する。本発明は、それによって特定のマーカーまたはハプロタイプの特定の対立遺伝子の検出が乳癌に対する感受性を示す方法について記載する。このような予後診断のアッセイまたは予測的なアッセイはまた、乳癌に関連する症状の発生前の被験者の予防的な治療の判定に使用され得る。本発明は、いくつかの実施態様では、診断の臨床的適用の方法、例えば、医療専門家によって行われる診断に関する。他の実施態様では、本発明は、素人によって行われる感受性の診断方法または判定方法に関する。当該素人は、遺伝子型の同定サービスの顧客であり得る。当該素人はまた、当該個体(すなわち、当該顧客)の遺伝子型の状態に基づく、特定の形質または疾病についての遺伝的危険因子に関するサービスを提供するための、個体から得たDNA試料上の遺伝子型分析を行う遺伝子型サービスの提供者であってもよい。遺伝子型の同定技術についての近年の技術的進歩(SNPマーカーの高処理の遺伝子型の同定(分子反転プローブアレイ技術(例えば、Affymetrix遺伝子チップ)など)、およびビーズアレイ技術(例えば、イルミナ(イルミナ)GoldenGateアッセイおよびInfiniumアッセイ)を含む)は、個体が、彼ら自身のゲノムが最大100万のSNPについて同時に、相対的に低い費用で、評価されることを可能にする。得られた遺伝子型の情報は、当該個体に利用可能となり、様々なSNPに関連する疾病または形質リスクについての情報(公的な文献および科学出版物からの情報)と比較され得る。従って、本願明細書記載の疾病に関連する対立遺伝子の診断の適用は、例えば、当該個体の遺伝子型のデータの分析を通じて当該個体、臨床試験の結果に基づいて医療従事者、または遺伝子型サービス提供者を含む第三者によって行われ得る。当該第三者は、特定の遺伝的危険因子(本願明細書に記載された遺伝子マーカーを含む)に関するサービスを提供するために当該顧客から得た遺伝子型情報を解釈するサービス提供者であってもよい。換言すれば、遺伝的危険率に基づく感受性の診断もしくは判定は、当該個体の遺伝子型についての情報および特定の遺伝的危険因子(例えば、特定のSNP)によって与えられえるリスクについての情報に基づいて、医療従事者、遺伝的カウンセラーもしくは遺伝子型の同定サービスを提供する第三者、リスクアセスメントサービスを提供する第三者、または素人(例えば、当該個体)によってされ得る。本願明細書の文脈では、用語「診断」、「感受性を診断する」および「感受性を判定する」とは、利用可能な診断方法(上記記載のものを含む)のいずれをも指すことを意味する。
ある実施態様では、個体から得たゲノムDNAを含む試料が集められる。このような試料は、例えば、さらに本願明細書に記載されるように、頬スワブ、唾液試料、血液試料、またはゲノムDNAを含む他の適した試料であり得る。次いで、当該ゲノムDNAは、当業者が利用できるいずれの一般的な技術(高処理アレイ技術など)を使用して分析される。このような遺伝子型の同定から得た結果は、簡便なデータ保存ユニット(コンピューターデータベースを含むデータ保有物、データ保存ディスク、または他の簡便なデータ保存手段など)に保存される。ある実施態様では、当該コンピューターデータベースは、オブジェクトデータベース、リレーショナルデータベースまたはポストリレーショナルデータベースである。当該遺伝子型データは、引き続いて、特定のヒトの状態の感受性変異体であることが知られるある変異体(本願明細書で記載された遺伝的変異体など)の存在について分析される。遺伝子型データは、いずれの簡便なデータクエリ方法を使用して、データ保存ユニットから検索され得る。当該個体の特定の遺伝子型によって与えられるリスクの算出は、当該個体の遺伝子型を、当該遺伝子型について以前に測定されたリスク(例えば、相対リスク(RR)またはおよびオッズ比(OR)として表わされる)(例えば、特定の疾病または形質(乳癌など)についてのリスクのある変異体のヘテロ接合性の保有)と比較することに基づくことができる。当該個体について算出されたリスクは、性別および民族性がマッチされた平均的な集団と比較した、ヒトについての相対リスクまたはヒトの特定の遺伝子型の相対リスクであってもよい。当該平均的な集団のリスクは、参照集団から得た結果を使用して、異なる遺伝子型のリスクの加重平均として表わしてもよく、当該集団に対する遺伝子型群のリスクを算出するための適切な算出を行ってもよい。あるいは、個体のリスクは、特定の遺伝子型の比較、例えば、リスクのある対立遺伝子の非保有者と比較した、マーカーのリスクのある対立遺伝子のヘテロ接合性の保有に基づく。集団平均の使用は、ある実施態様では、それが当該使用者にとって解釈しやすい測定、すなわち、当該集団の平均と比較して、彼の/彼女の遺伝子型に基づき、個体のリスクを与える測定を供給するため、より簡便であることがある。評価され、算出されたリスクは、ウェブサイト、好ましくは安全なウェブサイトを通じて顧客が利用できるようになり得る。
ある実施態様では、サービス提供者は、顧客によって提供された試料から得たゲノムDNAの単離工程、単離されたDNAの遺伝子型の同定の実行工程、遺伝子型データに基づく遺伝的危険率の算出工程、および当該顧客にリスクを報告する工程、の全工程を、提供されたサービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、当該個体についての遺伝子型データの解釈、すなわち、当該個体の遺伝子型データに基づく特定の遺伝的変異のリスク評価を、サービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、個体(顧客)から単離されたDNAの試料から開始した、遺伝子型の同定サービスおよび遺伝子型データの解釈を含むサービスを含めてもよい。
複数のリスク変異体についての全体のリスクは、標準的な方法論を使用して行われ得る。例えば、複合モデルの仮定、すなわち、個々のリスク変異体のリスクが全体の効果を確立するほどに拡大するという仮定は、複数のマーカーについての全体のリスクの単純な算出を可能にする。
さらに、ある他の実施態様では、本発明は、乳癌と診断されていない個体もしくは一般的な集団よりも、乳癌患者に頻繁に表れていない特定の遺伝子マーカー対立遺伝子またはハプロタイプを検出することによる、減少した乳癌に対する感受性についての診断方法、または診断の補助方法に関する。
本願明細書において記載され例証されるように、特定のマーカー対立遺伝子またはハプロタイプ(例えば、染色体5p12および10q26上のマーカー、例えば、表12、13および14に記載されたマーカーおよびハプロタイプ、例えば、マーカーrs4415084、rs10941679およびrs1219648、ならびにそれらと連鎖不平衡のマーカー)は、乳癌に関連する。1つの実施態様では、マーカー対立遺伝子またはハプロタイプは、乳癌に対する有意なリスクまたは感受性を与えるものである。別の実施態様では、本発明はヒト個体の乳癌に対する感受性の診断方法に関し、当該方法は、当該個体から得られた核酸試料の、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在の判定を含み、当該少なくとも1つの多型マーカーは、表12、13および14に記載された多型マーカー、ならびにそれらと連鎖不平衡のマーカーからなる群から選択される。別の実施態様では、本発明は、表12、13もしくは14に記載された少なくとも1つのマーカー対立遺伝子もしくはハプロタイプ、またはそれらと連鎖不平衡のマーカーについてのスクリーニングによる、ヒト個体の乳癌に対する感受性の診断方法に関する。別の実施態様では、マーカー対立遺伝子またはハプロタイプは、乳癌を有する、または乳癌に感受性がある被験者(罹患している)において、健康な被験者(集団対照などの対照)におけるその存在の頻度に比較して、より頻繁に存在する。ある実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの関連の有意性は、p値<0.05によって特徴付けられる。他の実施態様では、関連の有意性は、より小さいp値(<0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001つまたは<0.000000001など)によって特徴付けられる。
これらの実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの存在は、乳癌に対する感受性を示す。これらの診断の方法は、乳癌に関連する少なくとも1つのマーカー対立遺伝子またはハプロタイプの存在または不存在の検出に関する。本願明細書記載のハプロタイプは、様々な遺伝子マーカー(例えば、SNP、マイクロサテライトまたは他の遺伝的変異)の対立遺伝子の組み合わせを含む。特定のハプロタイプを構成する特定の遺伝子マーカー対立遺伝子の検出は、本願明細書記載の様々な方法および/または当該技術分野で知られた方法によって行われ得る。例えば、遺伝子マーカーは、核酸レベル(例えば、直接のヌクレオチド配列決定、または当業者に知られた他の手段による)または、遺伝子マーカーが乳癌に関連する核酸にコードされたタンパク質のコード配列に影響する場合は、アミノ酸レベル(例えば、タンパク質配列決定またはこのようなタンパク質を認識する抗体を使用したイムノアッセイによる)で検出され得る。本発明のマーカー対立遺伝子またはハプロタイプは、乳癌に関連するゲノムDNA配列断片に対応する。このような断片は、問題となっている多型マーカーまたはハプロタイプのDNA配列を含むがまた、マーカーまたはハプロタイプと強いLD(連鎖不平衡)のDNA分節を含んでいてもよい。1つの実施態様では、このような節は、(0.1超のr2値および/または|D’|>0.8によって決定されるような)当該マーカーまたはハプロタイプとLDにある節を含む。
1つの実施態様では、乳癌に対する感受性の診断は、ハイブリダイゼーション法を使用して達成され得る(Current Protocols in Molecular Biology、Ausubel F.ら、編集、John Wiley&Sons参照、全ての補遣を含む)。ゲノムDNA、RNA、もしくはcDNAの、試験の被験者もしくは個体から得られた生物学的試料(「試験試料」)は、乳癌を有する疑いのある被験者、乳癌に対する感受性がある疑いがある被験者、もしくは乳癌に遺伝的な傾向がある疑いがある被験者(「試験被験者」)から得られる。被験者は、成人、子供、または胎児であり得る。試験試料は、ゲノムDNAを含むいずれの供給源(血液試料、羊水試料、脳脊髄液試料、または皮膚、筋肉、頬側粘膜もしくは結膜粘膜、胎盤、消化管または他の器官などから得た組織試料)からでもあり得る。胎児の細胞または組織から得たDNAの試験試料は、適切な方法(羊水穿刺または絨毛採取などによる)によって得られうる。次いで、DNA、RNA、またはcDNA試料を試験した。特異的なマーカー対立遺伝子の存在は、特定の対立遺伝子に特異的な核酸プローブの配列特異的なハイブリダイゼーションによって示され得る。より多くの特異的なマーカー対立遺伝子または特異的なハプロタイプの存在は、それぞれ特定の対立遺伝子に特異的ないくつかの配列特異的な核酸プローブを使用することによって示され得る。1つの実施態様では、ハプロタイプは、特異的なハプロタイプに特異的な単一の核酸プローブ(すなわち、当該ハプロタイプの特徴を示す特定のマーカー対立遺伝子を含むDNA鎖に特異的にハイブリダイズする)によって示され得る。配列特異的なプローブは、ゲノムDNA、RNA、またはcDNAにハイブリダイズするように向けられ得る。「核酸プローブ」は、本願明細書で使用されるように、相補的配列にハイブリダイズするDNAプローブまたはRNAプローブであり得る。当業者であれば、配列特異的なハイブリダイゼーションが、特定の対立遺伝子が試験試料のゲノム配列に存在する場合のみに生じるように、このようなプローブを設計する方法を知っているだろう。本発明はまた、いずれの簡便な遺伝子型の同定方法(特定の多型マーカーの遺伝子型の同定のための市販の技術および方法を含む)を使用して、実行に移すことができる。
乳癌に対する感受性を診断するため、ハイブリダイゼーション試料は、乳癌に関連する核酸(ゲノムDNA試料など)を含む試験試料を、少なくとも1つの核酸プローブに接触させることで形成され得る。mRNAまたはゲノムDNAを検出するプローブの非限定的な例は、本願明細書記載のmRNAまたはゲノムDNA配列にハイブリダイズできる標識された核酸プローブである。核酸プローブは、例えば、全長の核酸分子、またはその部分(長さが少なくとも15、30、50、100、250または500ヌクレオチドの、適切なmRNAまたはゲノムDNAにストリンジェントな条件下で特異的にハイブリダイズするのに十分なオリゴヌクレオチドなど)であり得る。例えば、核酸プローブは、表12、13および14(配列番号1〜237)に記載されるマーカーを含む全てもしくは一部のヌクレオチド配列、またはFGF10、MRPS30、HCN1もしくはFGFR2遺伝子またはその断片を含むヌクレオチド配列、本願明細書に記載されるように、本願明細書に記載されたマーカーの少なくとも1つの対立遺伝子、もしくは本願明細書で記載された少なくとも1つのハプロタイプを任意に含むヌクレオチド配列を含むことができ、または、当該プローブはこのような配列の相補的配列であり得る。特定の実施態様では、当該核酸プローブは、表12、13および14(配列番号1〜237)のいずれか1つに記載されたマーカーを含むヌクレオチド配列のヌクレオチド配列の一部、FGF10、MRPS30、HCN1およびFGFR2遺伝子もしくはその断片を含むヌクレオチド配列、本願明細書に記載されるように、本願明細書に記載されたマーカーの少なくとも1つの対立遺伝子、または1つの多型マーカーの少なくとも1つの対立遺伝子もしくは少なくとも1つの本願明細書に記載された多型マーカーを含むハプロタイプを任意に含むヌクレオチド配列であり、またはプローブは、このような配列の相補的配列であり得る。本発明の診断のアッセイの使用のための他の適したプローブは、本願明細書に記載される。ハイブリダイゼーションは、当業者に周知の方法(例えば、Current Protocols in Molecular Biology、Ausubel、F.ら、編集、John Wiley&Sons を参照、全ての補遣を含む)によって行われ得る。1つの実施態様では、ハイブリダイゼーションは、特異的なハイブリダイゼーション、すなわち、ミスマッチのないハイブリダイゼーション(正確なハイブリダイゼーション)を意味する。1つの実施態様では、特異的なハイブリダイゼーションのハイブリダイゼーション条件は、高度にストリンジェンシーである。
特異的なハイブリダイゼーションは、存在する場合は、次いで、標準的な方法を使用して検出される。特異的なハイブリダイゼーションが、試験試料中で核酸プローブと核酸との間で生じた場合は、当該試料は当該核酸プローブに存在する当該ヌクレオチドに相補的な対立遺伝子を含む。この工程は、いずれの本発明のマーカー、または本発明のハプロタイプを構成するマーカーについて繰り返すことができ、または複数のプローブは1より多くのマーカー対立遺伝子を同時に検出するために、同時に使用され得る。特定のハプロタイプの1より多くのマーカー対立遺伝子を含む単一のプローブ(例えば、特定のハプロタイプを構成する2、3、4、5または全てのマーカーに相補的な対立遺伝子を含むプローブ)を設計することもまた、可能である。試料中の当該ハプロタイプの特定のマーカーの検出は、当該試料の供給源が特定のハプロタイプ(例えば、ハプロタイプ)を有し、従って、乳癌に感受性があることを示す。
1つの好ましい実施態様では、Kutyavinら(Nucleic Acid Res.34:e128(2006))によって記載されているように、その3’末端に蛍光部分または基、およびその5’末端に消光剤、およびエンハンサーオリゴヌクレオチドを含む、検出オリゴヌクレオチドプローブを利用する方法が使用される。蛍光部分は、Gig Harbor GreenまたはYakima Yellow、または他の適した蛍光部分であり得る。検出プローブは、検出されるSNP多型を含む短いヌクレオチド配列にハブリダイズするように設計される。好ましくは、SNPは、末端残基から、当該検出プローブの3’末端から−6残基のどこでもよい。エンハンサーは、当該検出プローブに対して3’の鋳型DNAにハイブリダイズする短いオリゴヌクレオチドプローブである。当該検出プローブと当該エンハンサーヌクレオチドプローブとが当該鋳型に結合すると、両方の間に1つのヌクレオチドの間隙が存在するように、当該プローブが設計される。間隙は、エンドヌクレアーゼ(エンドヌクレアーゼIVなど)によって認識される合成の脱塩基の部位を作る。酵素は、色素を完全に相補的な検出プローブから切断するが、ミスマッチを含む検出プローブを切断することはできない。従って、放出された蛍光部分の蛍光を測定することで、検出プローブのヌクレオチド配列によって定義される特定の対立遺伝子の存在の評価を行い得る。
検出プローブは、いずれの適したサイズでもあり得るが、好ましくは、当該プローブは相対的に短い。1つの実施態様では、当該プローブは長さが5〜100ヌクレオチドである。別の実施態様では、当該プローブは、長さが10〜50ヌクレオチドである。別の実施態様では、当該プローブは、長さが12〜30ヌクレオチドである。プローブの他の長さも可能であり、当業者の技能の範囲内である。
好ましい実施態様では、SNP多型を含む鋳型DNAは、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅される。このような実施態様では、増幅されたDNAは、当該検出プローブおよび当該エンハンサープローブの鋳型として役立つ。
検出プローブのある実施態様は、PCRによる鋳型の増幅に使用される当該エンハンサープローブおよび/または当該プライマーは、修飾塩基(修飾されたAおよび修飾されたGを含む)の使用を含む。修飾塩基の使用は、鋳型DNAへのヌクレオチド分子(プローブおよび/またはプライマー)の融解温度を調整することに対して有用であり得、例えば、低い割合のGもしくはC塩基を含む領域の融解温度を高めるため、その相補的Tに3つの水素結合を形成できる修飾されたAが使用され得、または、高い割合のGまたはC塩基を含む領域の融解温度を下げるため、例えば、二本鎖DNA分子中のその相補的C塩基に2つの水素結合のみを形成する修飾されたG塩基を使用することによって、有用であり得る。好ましい実施態様では、修飾塩基は、検出ヌクレオチドプローブの設計において使用される。当業者に知られたいずれの修飾塩基がこれらの方法において選択され得、適した塩基の選択は、本願明細書の教示および当業者に知られた市販の供給源から利用可能な公知の塩基に基づき、当業者の範囲内である。
さらに、または、あるいは、ペプチド核酸(PNA)プローブは、本願明細書記載の方法のハイブリダイゼーション法の核酸プローブに加えて、またはそれの代わりに使用され得る。PNAは、ペプチド様の無機の主鎖(有機の塩基(A、G、C、TまたはU)が、メチレンカルボニルリンカーを介してグリシンの窒素に結合している、N−(2−アミノエチル)グリシンユニットなど)を有するDNA模倣体である(例えば、Nielsen、P.ら、Bioconjug.Chem.5:3〜7(1994)参照)。PNAプローブは、乳癌に関連する1つ以上のマーカー対立遺伝子またはハプロタイプを含む疑いのある試料中の分子に特異的にハイブリダイズするように設計され得る。従って、PNAプローブのハイブリダイゼーションは、乳癌または乳癌に対する感受性を診断できる。
本発明の1つの実施態様では、被験者から入手されたゲノムDNAを含む試験試料は収集され、ポリメラーゼ連鎖反応(PCR)が、本発明の1つ以上のマーカーまたはハプロタイプを含む断片を増幅するために使用される。本願明細書記載のように、乳癌に関連する特定のマーカー対立遺伝子またはハプロタイプの同定は、様々な方法(例えば、配列分析、制限消化による分析、特異的なハイブリダイゼーション、一本鎖高次構造多型分析(SSCP)、電気泳動分析、など)を使用して達成され得る。別の実施態様では、診断は、定量的PCR(動力学的熱サイクル)を使用した発現分析によって達成される。当該技術は、例えば、市販の技術(TaqMan(登録商標)(アプライドバイオシステムズ社(Applied Biosystems)、カリフォルニア州、フォスターシティーなど)を利用し得る。当該技術は、乳癌に関連する核酸によってコードされるポリペプチドもしくはスプライシング変異体(単数または複数)の発現もしくは構成における変化の存在を評価できる。さらに、変異体(単数または複数)の発現は、物理的に数量化され得るか、または機能的に異なり得る。
別の本発明の方法では、制限消化による分析は、対立遺伝子が参照配列に関連する制限部位の創造または除去をもたらす場合、特定の対立遺伝子の検出に使用され得る。制限断片長多型(RFLP)分析は、例えば、Current Protocols in Molecular Biology(上記参照)に記載のように行うことができる。関連するDNA断片の消化様式は、試料中の特定の対立遺伝子の存在または不存在を示す。
配列分析はまた、乳癌に関連する多形性部位の特定の対立遺伝子またはハプロタイプの検出に使用され得る(例えば、表12、13および14(配列番号:1−237)の多型マーカーならびにそれらと連鎖不平衡のマーカー)。従って、1つの実施態様では、特定のマーカー対立遺伝子またはハプロタイプの存在または不存在の判定は、被験者または個体から入手したDNAまたはRNAの試験試料の配列分析を含む。PCRまたは他の適切な方法は、乳癌に関連する核酸の一部の増幅に使用され得、次いで、特定の対立遺伝子の存在は、試料中のゲノムDNAの多形性部位(またはハプロタイプの複数の多形性部位)の配列決定によって直接的に検出され得る。
対立遺伝子特異的なオリゴヌクレオチドはまた、対立遺伝子特異的なオリゴヌクレオチド(ASO)プローブと増幅されたオリゴヌクレオチドのドットブロットハイブリダイゼーションを使用して、乳癌に関連した核酸(例えば、表12、13および14の多型マーカー、ならびにそれらと連鎖不平衡のマーカー)の特定の対立遺伝子の存在を検出するために使用され得る(例えば、Saiki R.ら、Nature、324:163〜166(1986)参照)。「対立遺伝子特異的なオリゴヌクレオチド」(本願明細書では「対立遺伝子特異的なオリゴヌクレオチドプローブ」とも呼ばれる)は、約10〜50塩基対または約15〜30塩基対のオリゴヌクレオチドであり、乳癌に関連した核酸に特異的にハイブリダイズし、多形性部位に特定の対立遺伝子を含む(例えば、本願明細書記載のマーカーまたはハプロタイプ)。乳癌に関連した1つ以上の特定の核酸に特異的な対立遺伝子特異的なオリゴヌクレオチドプローブは、標準的な方法(例えば、Current Protocols in Molecular Biology参照、上記参照)を使用して調製され得る。PCRは、所望の領域を増幅するために使用され得る。増幅された領域を含むDNAは、標準的な方法(例えば、Current Protocols in Molecular Biology参照、上記参照)を使用してドットブロットされ得、当該ブロットは、オリゴヌクレオチドプローブと接触され得る。増幅された領域へのプローブの特異的なハイブリダイゼーションの存在を、次いで、検出し得る。被験者から得たDNAへの対立遺伝子特異的なオリゴヌクレオチドプローブの特異的なハイブリダイゼーションは、癌(乳癌を含む)に関連する多形性部位の特定の対立遺伝子を示す(例えば、Gibbs、R.ら、Nucleic Acids Res.、17:2437〜2448(1989)および国際公開第93/22456号パンフレット参照)。
ロックド核酸(LNA)のようなこのような類似体に加え、プライマーおよびプローブのサイズは、8塩基程度に減少され得る。LNAは、フラノース環中の2’および4’位が、O−メチレン(オキシ−LNA)、S−メチレン(チオ−LNA)、またはアミノメチレン(アミノ−LNA)部分を介して結合している、二環式DNA類似体の新規なクラスある。全てのこれらのLNA変異に共通していることは、DNA類似体について報告されているうちで、これまでのところ最も高い、相補的核酸に対する親和性である。例えば、特定の全オキシ−LNA九量体は、対応するDNA九量体についてDNAおよびRNAの両方が28℃であるのと対照的に、相補的DNAまたはRNAとの複合体であるとき、それぞれ、64℃および74℃の融解温度(Tm)を有することが示された。Tmの実質的な上昇はまた、LNAモノマーが標準的なDNAモノマーまたはRNAモノマーと組み合わされて使用されるときに得られる。プライマーおよびプローブについては、LNAモノマーがどこに含まれているかに依存し(例えば、3’末端、5’末端、またはその中間)、Tmはかなり上昇し得る。
別の実施態様では、被験者から得た標的の核酸配列の分節に相補的なオリゴヌクレオチドプローブのアレイは、乳癌に関連する核酸(例えば、表12、13および14(配列番号1〜237)の多型マーカー、ならびにそれらと連鎖不平衡のマーカー)の多型性を同定するために使用され得る。例えば、オリゴヌクレオチドアレイが使用され得る。オリゴヌクレオチドアレイは、典型的には、異なる公知の部位の基質の表面に結合される複数の異なるオリゴヌクレオチドプローブを含む。これらのオリゴヌクレオチドアレイはまた、「Genechips(商標)」として記載され、一般的に、当該技術分野において記載される(例えば、米国特許第5,143,854号明細書、国際公開第90/15070号パンフレットおよび国際公開第92/10092号パンフレットを参照)。これらのアレイは、一般的に、フォトリソグラフィー法および固相オリゴヌクレオチド合成法の組み合わせを取り込んだ機械的合成法もしくは光指向合成法、または当業者に知られた他の方法(例えば、Bier、F.F.ら Adv Biochem Eng Biotechnol 109:433〜53(2008);Hoheisel、J.D.、Nat RevGenet 7:200〜10(2006);Fan、J.B.、ら Methods Enzymol 410:57〜73(2006);Raqoussis、J.およびElvidge、G.、Expert Rev MoI Diagn 6:145〜52(2006);Mockler、T.C.ら Genomics 85:1〜15(2005)、およびそれらの参考文献を参照(それぞれの全体の教示を参照によって本願明細書に援用する))を使用して作製され得る。多型性の検出のためのオリゴヌクレオチドアレイの調製および使用についての多くの付加的な記載は、例えば、米国特許第6,858,394号明細書、米国特許第6,429,027号明細書、米国特許第5,445,934号明細書、米国特許第5,700,637号明細書、米国特許第5,744,305号明細書、米国特許第5,945,334号明細書、米国特許第6,054,270号明細書、米国特許第6,300,063号明細書、米国特許第6,733,977号明細書、米国特許第7,364,858号明細書、欧州特許第619 321号明細書、および欧州特許第373 203号明細書に見出すことができ、これらの全体の教示は、参照によって本願明細書に組み込まれる。
当業者に利用可能な核酸分析の他の方法は、乳癌に関連する多形性部位の特定の対立遺伝子を検出するために使用され得る。代表的な方法は、例えば、直接のマニュアル配列決定(ChurchおよびGilbert、Proc.Natl.Acad.Sci.USA、81:1991〜1995(1988);Sanger F.ら、Proc.Natl.Acad.Sci.USA、74:5463〜5467(1977);Beavisら、米国特許第5,288,644号明細書);自動化した蛍光配列決定;一本鎖高次構造多型性アッセイ(SSCP);クランプ変性ゲル電気泳動(clamped denaturing gel electrophoresis)(CDGE);変性剤濃度勾配ゲル電気泳動(DGGE)(Sheffield V.ら、Proc.Natl.Acad.Sci.USA、86:232〜236(1989))、移動度シフトアッセイ(Orita M.ら、Proc.Natl.Acad.Sci.USA、86:2766〜2770(1989))、制限酵素解析(Flavell R.ら、Cell、15:25〜41(1978);Geever R.ら、Proc.Natl.Acad.Sci.USA、78:5081〜5085(1981));ヘテロ二本鎖分析;化学的ミスマッチ切断(chemical mismatch cleavage)(CMC)(Cotton R.ら、Proc.Natl.Acad.Sci.USA、85:4397〜4401(1985));リボヌクレアーゼプロテクションアッセイ(Myers R.ら、Science、230:1242〜1246(1985);ヌクレオチドのミスマッチを認識するポリペプチド(E.coli mutSタンパク質など)の使用;および対立遺伝子特異的なPCRを含む。
本発明の別の実施態様では、乳癌の診断または乳癌に対する感受性の診断は、本発明の遺伝子マーカー(単数または複数)もしくはハプロタイプ(単数または複数)がポリペプチドの構成もしくは発現の変化をもたらすそれらの例における乳癌に関連した核酸によってコードされたポリペプチドの発現および/または構成を試験することでなされ得る。従って、乳癌に対する感受性の診断は、これらのポリペプチドの1つ、または、本発明の遺伝子マーカーもしくはハプロタイプが当該ポリペプチドの構成または発現(例えば、FGF10、MRPS30、HCN1およびFGFR2遺伝子のうち1つ以上)の変化をもたらす例における、乳癌に関連した核酸にコードされた別のポリペプチドの、発現および/または構成を試験することによってなされ得る。乳癌への関連を示す本発明のハプロタイプおよびマーカーは、これらの近くの遺伝子のうち1つ以上へのその効果を通じて役割を果たしているのかも知れない。これらの遺伝子に影響する可能性のある機構は、例えば、転写への効果、RNAスプライシングへの効果、mRNAの別のスプライシングの形態の相対的な量の変化、RNAの安定性への効果、核から細胞質への輸送への効果、ならびに翻訳の効率および正確性への効果を含む。
従って、別の実施態様では、乳癌への関連を示す本発明の変異体(マーカーまたはハプロタイプ)は、近くの遺伝子の発現に影響する。遺伝子発現に影響する調節エレメントは、遺伝子のプロモーター領域から数十キロベースまたは数百キロベースでさえ離れて位置しているかも知れないことは周知である。本発明の少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在をアッセイすることによって、このような近くの遺伝子の発現レベルを評価できる。従って、本発明のマーカーまたはハプロタイプの検出は、FGF10、MRPS30、HCN1およびFGFR2遺伝子のうち1つ以上の発現の評価に使用され得ると考えられる。
酵素結合免疫吸着検定法(ELISA)、ウエスタンブロット、免疫沈降および免疫蛍光を含む、様々な方法がタンパク質発現レベルの検出に使用され得る。被験者から得た試験試料は、発現の変化および/または乳癌に関連した核酸にコードされたポリペプチドの構成の変化の存在について評価される。乳癌に関連した核酸にコードされたポリペプチドの発現の変化は、例えば、定量的ポリペプチドの発現(すなわち、産生されたポリペプチドの量)の変化であり得る。乳癌に関連した核酸によってコードされたポリペプチドの構成の変化は、定性的なポリペプチドの発現(例えば、変異ポリペプチドの発現または異なるスプライシング変異体の発現)の変化である。1つの実施態様では、乳癌に対する感受性の診断は、乳癌に関連する核酸によってコードされた特定のスプライシング変異体、またはスプライシング変異体(例えば、FGF10、MRPS30、およびHCN1遺伝子をコードする核酸)の特定の様式の検出によってなされる。
このような変化の両方(定量的および質的)もまた、存在し得る。ポリペプチドの発現または構成の「変化」は、本願明細書で使用されるように、対照試料のポリペプチドの発現または構成と比較した、試験試料の発現または構成の変化を意味する。対照試料は、試験試料に対応する試料(例えば、同様のタイプの細胞からもの)であり、乳癌に罹患していない被験者および/または乳癌に対する感受性を有さない被験者から得たものである。1つの実施態様では、対照試料は、本願明細書記載のマーカー対立遺伝子またはハプロタイプを有さない被験者から得たものである。同様に、対照試料と比較した、試験試料における1つ以上の異なるスプライシング変異体の存在、または試験試料における著しく異なる量の異なるスプライシング変異体の存在は、乳癌に対する感受性を示し得る。対照試料と比較した、試験試料におけるポリペプチドの発現または構成の変化は、対立遺伝子が対照試料における参照に関連するスプライシングの部位を変化させる例における、特定の対立遺伝子を示し得る。核酸によってコードされたポリペプチドの発現または構成を試験する様々な手段が当業者に知られ、かつ、使用され得、分光法、比色分析、電気泳動、等電点電気泳動、および、イムノブロッティング(例えば、Current Protocols in Molecular Biology、特に10章、上記参照)などの、イムノアッセイ(例えば、Davidら、米国特許第4,376,110号明細書)を含む。
例えば、1つの実施態様では、乳癌に関連した核酸にコードされたポリペプチドに結合できる抗体(例えば、検出可能な標識を有する抗体)が使用され得る。抗体は、ポリクローナル抗体またはモノクローナル抗体であり得る。インタクトな抗体、またはその断片(例えば、Fv、Fab、Fab’、F(ab’)2)が使用され得る。用語「標識された」は、プローブまたは抗体に関し、検出可能な物質をプローブまたは抗体に結合することによって(すなわち、物理的に連結することによって)プローブまたは抗体を直接的に標識すること、および直接的に標識された別の試薬との反応性によってプローブまたは抗体を間接的に標識することを含むことが意図される。間接的な標識の例は、標識された2次抗体(例えば、蛍光標識された2次抗体)を使用した1次抗体の検出、および蛍光標識されたストレプトアビジンによって検出され得るようにビオチンによるDNAプローブの末端標識を含む。
当該方法の1つの実施態様では、試験試料中の乳癌に関連する核酸(例えば、FGF10、MRPS30、およびHCN1)にコードされたポリペプチドのレベルまたは量は、対照試料中のポリペプチドのレベルまたは量と比較される。対照試料中のポリペプチドのレベルまたは量よりもより高く、またはより低く、そのため、相違が統計的に有意な、試験試料中のポリペプチドのレベルまたは量は、核酸によってコードされたポリペプチドの発現の変化を示し、これは発現の相違を引き起こす原因となる特定の対立遺伝子またはハプロタイプであると診断される。あるいは、試験試料中のポリペプチドの構成は、対照試料中のポリペプチドの構成と比較される。別の実施態様では、ポリペプチドのレベルまたは量ならびに構成の両方は、試験試料および対照試料において評価され得る。
別の実施態様では、乳癌に対する感受性の診断は、本発明の少なくとも1つのマーカーまたはハプロタイプ(例えば、表12、13および14(配列番号1〜237)に記載されたマーカー、ならびにそれらと連鎖不平衡のマーカーの関連する対立遺伝子)を、さらにタンパク質に基づいたアッセイ、RNAに基づいたアッセイまたはDNAに基づいたアッセイと組み合わせて検出することによってなされる。本発明の方法はまた、被験者の家族歴および危険因子(例えば、環境的な危険因子、生活習慣の危険因子)の分析と組み合わせて使用され得る。
(キット)
本発明の方法において有用なキットは、本願明細書記載の方法のいずれにおいても有用な要素を含み、例えば、核酸増幅のためのプライマー、ハイブリダイゼーションプローブ、制限酵素(例えば、RFLP分析のため)、対立遺伝子特異的なオリゴヌクレオチド、本願明細書記載の本発明の核酸によってコードされた変化したポリペプチド(例えば、本発明の少なくとも1つの多型マーカーおよび/またはハプロタイプを含むゲノム分節)に結合する抗体、または、本願明細書記載の本発明の核酸によってコードされた変化していない(ネイティブな)ポリペプチドに結合する抗体、乳癌に関連する核酸を増幅する手段、乳癌に関連する核酸の核酸配列を分析する手段、乳癌に関連する核酸によってコードされたポリペプチドのアミノ酸配列を分析する手段、などを含む。当該キットは、例えば、必要なバッファー、本発明の核酸を増幅する核酸プライマー(例えば、本願明細書記載の1つ以上の多型マーカー)、ならびにこのようなプライマーおよび必要な酵素(例えば、DNAポリメラーゼ)を使用して増幅した断片の対立遺伝子特異的な検出のための試薬を含み得る。さらに、キットは、本発明の方法と組み合わせて使用されるアッセイのための試薬、例えば、乳癌の診断のアッセイと使用するための試薬を提供し得る。
1つの実施態様では、本発明は、被験者における乳癌または乳癌の感受性の存在を検出するために、被験者から得られた試料をアッセイするためのキットであり、当該キットは、当該個体のゲノムにおける本発明の少なくとも1つの多型の少なくとも1つの対立遺伝子を選択的に検出するために必要な試薬を含む。特定の実施態様では、当該試薬は、本発明の少なくとも1つの多型を含む当該個体のゲノムの断片にハイブリダイズする少なくとも1つの近接するオリゴヌクレオチドを含む。別の実施態様では、当該試薬は、被験者から得られたゲノム分節の逆ストランドにハイブリダイズする少なくとも1対のオリゴヌクレオチドを含み、各オリゴヌクレオチドプライマー対は、少なくとも1つの多型を含む当該個体のゲノムの断片を選択的に増幅するように設計され、当該多型は、表12、13および14(配列番号1〜237)に記載された多型、ならびにそれらと連鎖不平衡の多型マーカーからなる群から選択される。さらに別の実施態様では、当該断片は、サイズが少なくとも20塩基対である。このようなオリゴヌクレオチドまたは核酸(例えば、オリゴヌクレオチドプライマー)は、乳癌を示す多型に隣接する核酸配列(例えば、SNPまたはマイクロサテライト)の部分を使用して設計され得る。別の実施態様では、当該キットは、乳癌に関連する1つ以上の特定の多型マーカーまたはハプロタイプを対立遺伝子特異的に検出できる1つ以上の標識された核酸、および当該標識の検出のための試薬を含む。適した標識は、例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識を含む。
特定の実施態様では、当該キットの試薬によって検出される当該多型マーカーまたはハプロタイプは、表12、13および14のマーカーからなる群から選択される1つ以上のマーカー、2つ以上のマーカー、3つ以上のマーカー、4つ以上のマーカーまたは5つ以上のマーカーを含む。別の実施態様では、検出されるマーカーは、マーカーrs10941679、rs7703618、rs4415084、rs2067980、rs10035564、rs11743392、rs7716600およびrs1219648から選択される。別の実施態様では、検出されるマーカーまたはハプロタイプは、0.2より大きいr2値によって定義される、表12、13および14に記載されたマーカーからなるマーカー群の少なくとも1つと強い連鎖不平衡のマーカー群のうちの少なくとも1つのマーカーを含む。さらに別の実施態様では、検出されるマーカーまたはハプロタイプは、マーカーrs10941679、rs7703618、rs4415084、rs2067980、rs10035564、rs11743392、rs7716600およびrs1219648ならびにそれらと連鎖不平衡のマーカーからなるマーカー群から選択される少なくとも1つのマーカーを含む。
1つの好ましい実施態様では、本発明のマーカーを検出するキットは、検出されるSNP多型性を含む鋳型DNAの分節にハイブリダイズする検出オリゴヌクレオチドプローブ、エンハンサーオリゴヌクレオチドプローブおよびエンドヌクレアーゼを含む。当該検出オリゴヌクレオチドプローブは、その3’末端に蛍光部分または蛍光基およびその5’末端の消光剤を含み、エンハンサーオリゴヌクレオチドは、Kutyavinら(Nucleic Acid Res.34:el28(2006))によって記載されるように使用される。当該蛍光部分は、ギグハーバーグリーン(Gig Harbor Green)もしくはヤキマイエロー(Yakima Yellow)、または他の適した蛍光部分であり得る。当該検出プローブは、検出されるSNP多型性を含む短いヌクレオチド配列とハイブリダイズするように設計される。好ましくは、当該SNPは、末端残基〜当該検出プローブの3’末端から−6残基のどこでもよい。当該エンハンサーは、当該検出プローブに対して3’のDNA鋳型にハイブリダイズする短いオリゴヌクレオチドプローブである。当該プローブは、当該検出プローブと当該エンハンサーヌクレオチドプローブが当該鋳型に結合された場合、これらの間に1つのヌクレオチド間隙が存在するように設計される。当該間隙は、エンドヌクレアーゼ(エンドヌクレアーゼIVなど)によって認識される合成脱塩基部位を作る。当該酵素は、色素を完全に相補的な検出プローブから切断するが、ミスマッチを含む検出プローブを切断できない。従って、放出された蛍光部分の蛍光を測定することによって、検出プローブのヌクレオチド配列によって定義される特定の対立遺伝子の存在の評価を行うことができる。
当該検出プローブは、いずれの適した大きさでもよい(好ましくは当該プローブは、相対的に短い)。1つの実施態様では、当該プローブは、長さが5〜100ヌクレオチドである。別の実施態様では、当該プローブは、長さが10〜50ヌクレオチドであり、別の実施態様では、当該プローブは長さが12〜30ヌクレオチドである。当該プローブの他の長さも可能であり、当業者の技能の範囲内である。
好ましい実施態様では、SNP多型性を含むDNA鋳型は、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅され、このような増幅のためのプライマーは、試薬キットに含まれる。このような実施態様では、増幅されたDNAは、当該検出プローブの鋳型および当該エンハンサープローブの鋳型として役立つ。
当該検出プローブのある実施態様では、当該エンハンサープローブ、および/またはPCRによる鋳型の増幅に使用されるプライマーは、修飾塩基(修飾されたAおよび修飾されたGを含む)の使用を含む。修飾塩基の使用は、ヌクレオチド分子(プローブおよび/またはプライマー)の当該鋳型DNAへの融解温度の調整に有用であり得、例えば、低い割合のGまたはC塩基を含む領域の融解温度を上昇させるためには、相補的なTに対して3つの水素結合を形成することができる修飾されたAが使用されることができ、または、高い割合のGまたはC塩基を含む領域の融解温度を低下させるためには、例えば、二本鎖DNA分子の相補的なC塩基に対して2つの水素結合のみを形成する修飾されたG塩基を使用することによればよい。好ましい実施態様では、修飾塩基は、当該検出ヌクレオチドプローブの設計に使用される。当業者に知られたいずれの修飾塩基も、これらの方法において選択されることができ、適した塩基の選択は、本願明細書の教示、および当業者に知られた市販の供給源から入手できる公知の塩基に基づき、十分に当業者の技能の範囲内である。
このような実施態様の1つは、当該マーカーまたはハプロタイプの存在は、乳癌に対する感受性(増加した感受性または減少した感受性)を示す。別の実施態様では、当該マーカーまたはハプロタイプの存在は、乳癌治療薬に対する反応を示す。別の実施態様では、マーカーまたはハプロタイプの存在は、乳癌の予後診断を示す。さらに別の実施態様では、マーカーまたはハプロタイプの存在は、乳癌治療の進行を示す。このような治療は、手術、薬物療法、または他の手段(例えば、生活スタイルの変化)による介入を含んでいてもよい。
(治療薬)
本発明の変異体(例えば、本発明のマーカーおよび/またはハプロタイプ、例えば、表12、13および14に記載されたマーカー、例えば、rs4415084、rs10941679、rs1219648)は、乳癌の新規な治療上の標的を同定するために使用され得る。例えば、乳癌に関連する変異体(マーカーおよび/もしくはハプロタイプ)を含む遺伝子、もしくはこれらと連鎖不平衡の遺伝子(例えば、1つ以上のFGF10、MRPS30、HCN1およびFGFR2遺伝子)、またはこれらの生成物、ならびにこれらの変異遺伝子もしくはその産物によって直接的もしくは間接的に制御され、または相互作用する遺伝子またはこれらの生成物は、乳癌の治療、または乳癌に関連する症候の発生の予防もしくは遅延のための治療薬の開発の標的にされ得る。治療薬は、1つ以上の、例えば、小さい非タンパク質分子および非核酸分子、タンパク質、ペプチド、タンパク質断片、核酸(DNA、RNA)、PNA(ペプチド核酸)、または標的遺伝子もしくはこれらの遺伝子産物の機能および/もしくはレベルを調節できるこれらの誘導体もしくは模倣薬を含んでいてもよい。
本発明の核酸および/もしくは変異体、または本発明の1つ以上の変異体を含む核酸(例えば、配列番号1〜237のいずれか1つに記載される配列を有する核酸、またはその断片)、またはこれらの相補的な配列を含む核酸は、細胞、組織もしくは器官における遺伝子発現を制御するためのアンチセンス構築物として使用されてもよい。アンチセンス技術に関連する方法論は当業者に周知であり、AntisenseDrug Technology: Principles、Strategies、and Applications、Crooke、編集、Marcel Dekker Inc.、New York(2001)において記載され、概説されている。通常は、アンチセンス核酸分子は、遺伝子によって発現されたmRNAのある領域に相補的となるように設計され、そのため、当該アンチセンス分子は当該mRNAにハイブリダイズし、従って、mRNAがタンパク質に翻訳されるのをブロックする。アンチセンスオリゴヌクレオチドのいくつかのクラスは当業者に公知であり、切断剤(cleaver)および遮断剤(blocker)を含む。前者は標的RNA部位に結合し、当該標的RNAを切断する細胞内ヌクレアーゼ(例えば、リボヌクレアーゼHまたはリボヌクレアーゼL)を活性化する。遮断剤は、標的RNAに結合し、リボソームの立体的な障害によってタンパク質の翻訳を阻害する。遮断剤の例は、核酸、モルホリノ化合物、ロックド核酸およびメチルホスホン酸を含む(Thompson、Drug Discovery Today、7:912〜917(2002))。アンチセンスオリゴヌクレオチドは、治療薬として直接的に有用であり、また、例えば、遺伝子ノックアウトまたは遺伝子ノックダウン実験によって、遺伝子機能を判定し、検証するのにも有用である。アンチセンス技術は、さらに、Laveryら、Curr.Opin.Drug Discov.Devel.6:561〜569(2003)、Stephensら、Curr.Opin.Mol.Ther.5:118〜122(2003)、Kurreck、Eur.J.Biochem.270:1628〜44(2003)、Diasら、MoI. Cancer Ter.1:347〜55(2002)、Chen、Methods MoI.Med.75:621〜636(2003)、Wangら、Curr.Cancer Drug Targets 1:177〜96(2001)、およびBennett、Antisense Nucleic Acid Drug.Dev.12:215〜24(2002)に記載される。
本願明細書記載の変異体は、特定の変異体に特異的なアンチセンス試薬の選択および設計に使用され得る。本願明細書記載の変異体についての情報を使用し、本発明の1つ以上の変異を含むmRNA分子を特異的に標的にするアンチセンスオリゴヌクレオチドまたは他のアンチセンス分子が設計され得る。このようにして、1つ以上の本発明の変異体(マーカーおよび/またはハプロタイプ)を含むmRNA分子の発現は、阻害またはブロックされ得る。1つの実施態様では、アンチセンス分子は、標的核酸の特定の対立遺伝子の形態(すなわち、標的の核酸の1つまたはのいくつかの変異体(対立遺伝子および/またはハプロタイプ))であって、それによって当該特定の対立遺伝子またはハプロタイプに起因する生成物の翻訳を阻害するが、標的核酸分子の特定の多形性部位の他のまたは代わりの変異体に結合しないものに、特異的に結合するように設計される。
アンチセンス分子は、遺伝子発現、従ってタンパク質発現を阻害するために、mRNAを不活性化するために使用され得るため、当該分子は疾病または障害(例えば、乳癌)の治療に使用され得る。この方法論は、翻訳されるmRNAの能力を減弱するmRNAの1以上の領域に相補的なヌクレオチド配列を含むリボザイムによる切断を含むことができる。このようなmRNA領域は、例えば、タンパク質をコードする領域、特に触媒活性、基質および/もしくはリガンド結合部位に対応するタンパク質をコードする領域、またはタンパク質の他の機能的領域を含む。
RNA干渉(RNAi)の現象は、C.elegans(Fireら、Nature 391:806〜11(1998))でのその最初の発見から、過去10年間で活発に研究されており、近年、ヒト疾病の治療におけるその有望な使用が、活発に探究されている(KimおよびRossi、Nature Rev.Genet.8:173〜204における概説(2007))。RNA干渉(RNAi)はまた、遺伝子サイレンシングとも呼ばれ、特定の遺伝子を遮断するための二本鎖RNA分子(dsRNA)の使用に基づく。細胞では、細胞質二本鎖RNA分子(dsRNA)は、細胞の複合体によって、低分子干渉RNA(siRNA)に処理される。siRNAは、標的mRNA上の特定の部位へとタンパク質とRNAの複合体のターゲティングを導き、mRNAの切断を引き起こす(Thompson、Drug Discovery Today、7:912〜917(2002))。siRNA分子は、典型的には、長さが約20、21、22または23ヌクレオチドである。従って、本発明の1つの態様は、単離した核酸分子、およびRNA干渉のためのこれらの分子の使用、すなわち低分子干渉RNA分子(siRNA)としての使用に関する。1つの実施態様では、単離された核酸分子は長さが18〜26ヌクレオチド、好ましくは長さが19〜25ヌクレオチド、より好ましくは長さが20〜24ヌクレオチド、およびより好ましくは長さが21、22または23ヌクレオチドである。
RNAiを介した遺伝子サイレンシングの別の経路は、miRNA前駆体(pre−miRNA)を生じるために細胞内で処理される、内因的にコードされたプライマリーマイクロRNA(pri−miRNA)転写物に始まる。これらのmiRNA分子は、核から細胞質に輸送され、そこでこれらは成熟したmiRNA分子(miRNA)を生じるための処理を経て、mRNAの3’の非翻訳領域の標的部位を認識することによって翻訳の阻害に方向付けられ、引き続いて、P体(P−bodies)の処理によってmRNAが分解する(KimおよびRossi、Nature Rev.Genet.8:173〜204(2007)における概説)。
RNAiの臨床的適用は、好ましくはサイズが約20〜23ヌクレオチド、および好ましくは2ヌクレオチドの3’重複を有する合成二本鎖siRNAのを組み入れることを含む。遺伝子発現のノックダウンは、標的mRNAの配列特異的な設計によって確立される。このような分子の至適な設計および合成のためのいくつかの市販の部位は、当業者に知られている。
他の適用は、より長いsiRNA分子(典型的には長さが25〜30ヌクレオチド、好ましくは約27ヌクレオチド)、および低分子ヘアピン型RNA(shRNA;典型的には長さが約29ヌクレオチド)を提供する。後者は、Amarzguiouiら(FEBS Lett.579:5974〜81(2005))が記載しているように、自然に発現される。化学的に合成したsiRNAおよびshRNAは、in vivoでの処理のための基質であり、いくつかの場合では、より短い設計よりも、より強力な遺伝子サイレンシングを提供する(Kimら、Nature Biotechnol.23:222〜226(2005);Siolasら、Nature Biotechnol.23:227〜231(2005))。一般的に、siRNAは、その細胞内濃度が、引き続く細胞分裂によって希釈されるため、遺伝子発現の一過性のサイレンシングを提供する。対照的に、発現されたshRNAは、shRNAの転写が起こっている限り、標的転写物の、長期間の安定したノックダウンを媒介する(Marquesら、Nature Biotechnol.23:559〜565(2006);Brummelkampら、Science 296:550〜553(2002))。
siRNA、miRNAおよびshRNAを含めたRNAi分子は、配列依存性様式で作用するため、本発明の変異体(例えば、表12、13および14に記載されたマーカーおよびハプロタイプ)は、特定の対立遺伝子および/またはハプロタイプ(例えば、本発明の対立遺伝子および/またはハプロタイプ)を含む特定の核酸分子を認識する一方、他の対立遺伝子またはハプロタイプを含む核酸分子を認識しないRNAi試薬を設計するために使用され得る。従って、これらのRNAi試薬は、標的核酸分子を認識し、破壊できる。アンチセンス試薬と同様に、RNAi試薬は治療薬として(すなわち、疾病に関連する遺伝子または疾病に関連する遺伝子変異を遮断するために)有用であり得るが、遺伝子機能を特徴付け、検証すること(例えば、遺伝子ノックアウト実験または遺伝子ノックダウン実験による)にもまた、有用であるかも知れない。
RNAiの送達は、当業者に知られた方法論の範囲によって行ってもよい。非ウイルスデリバリーを利用する方法は、コレステロール、安定した核酸脂質粒子(SNALP)、重鎖抗体の断片(Fab)、アプタマーおよびナノ粒子を含む。ウイルスデリバリー方法は、レンチウイルス、アデノウイルスおよびアデノ随伴ウイルスの使用を含む。siRNA分子は、いくつかの実施態様では、その安定性を増加するために化学的に修飾される。これは、2’−O−メチルプリンおよび2’−フルオロピリミジンを含む、リボースの2’位での修飾を含むことができ、リボヌクレアーゼ活性に対する抵抗性を提供する。他の化学的修飾も可能であり、当業者に知られている。
下記の参考文献は、さらなるRNAiの概略、およびRNAiを用いた特定の遺伝子のターゲティングの可能性を提供する:KimおよびRossi、Nat.Rev.Genet.8:173〜184(2007)、ChenおよびRajewsky、Nat.Rev.Genet.8:93〜103(2007)、Reynoldsら、Nat.Biotechnol.22:326〜330(2004)、Chiら、Proc.Natl.Acad.Sci.USA 100:6343〜6346(2003)、Vickersら、J.Biol.Chem.278:7108〜7118(2003)、Agarni、Curr.Opin.Chem.Biol.6:829〜834(2002)、Laveryら、Curr.Opin.Drug Discov.Devel.6:561〜569(2003)、Shi、Trends Genet.19:9〜12(2003)、Shueyら、Drug Discov.Today 7:1040〜46(2002)、McManusら、Nat.Rev.Genet.3:737〜747(2002)、Xiaら、Nat.Biotechnol.20:1006〜10(2002)、Plasterkら、curr.Opin.Genet.Dev.10:562〜7(2000)、Bosherら、Nat.Cell Biol.2:E31〜6(2000)、およびHunter、Curr.Biol.9:R440〜442(1999)。
乳癌の発生について増加した素因またはリスクを引き起こす遺伝的欠陥、または乳癌の原因となる欠陥は、欠陥を有する被験者に、通常の/野生型のヌクレオチド(単数または複数)を遺伝的欠陥部位で提供する修復配列を取り込む核酸断片を投与することによって、持続的に矯正されるかも知れない。このような部位特異的な修復配列は、被験者のゲノムDNAの内因性修復を促進するように機能するRNA/DNAオリゴヌクレオチドを含んで(concompass)もよい。修復配列の投与は、アニオン性リポソームに被包されたポリエチレンイミンとの複合体、ウイルスベクター(アデノウイルスベクターなど)、または投与した核酸の細胞内吸収を促進するのに適した他の医薬組成物などの、適切な媒体によって行われてもよい。次いで、遺伝的欠陥は、キメラのオリゴヌクレオチドが被験者のゲノムへの、通常の配列の組み込みを引き起こし、通常の/野生型の遺伝子産物の発現を導くため、克服されるかも知れない。置換が増加し、従って、持続性の修復および疾病もしくは疾患に関連する症候の軽減を与える。
本発明は、乳癌の治療に使用され得る化合物または薬剤を同定するための方法を提供する。従って、本発明の変異体は、治療薬の同定および/または開発の標的として有用である。ある実施態様では、このような方法は、本発明の少なくとも1つの変異体(マーカーおよび/またはハプロタイプ)、または核酸のコードされた生成物を含む核酸の活性および/または発現を調節するための薬剤または化合物の能力のアッセイを含む。これは、例えば、1つ以上のFGF10、MRPS30、HCN1およびFGFR2遺伝子、ならびにそれらの遺伝子産物を含む。これは、次に、コードされた核酸生成物の所望でない活性もしくは発現を、阻害もしくは変化させる薬剤または化合物を同定するために使用され得る。このような実験を行うためのアッセイは、当業者に知られているように、細胞系または無細胞系で行われ得る。細胞系は、興味ある核酸分子を自然に発現している細胞、または、ある所望の核酸分子を発現するために、遺伝的に修飾された組み換え細胞を含む。
患者における変異遺伝子の発現は、変異を含む核酸配列(例えば、少なくとも1つの変異を含むRNAに転写されることができ、次にタンパク質に翻訳されることができる、少なくとも1つの本発明の変異を含む遺伝子)の発現、または通常の転写物の発現のレベルもしくは様式に影響する変異(例えば、遺伝子の制御領域または調節領域における変異)によって、通常の/野生型の核酸配列が変化した発現によって評価され得る。遺伝子発現のアッセイは、直接の核酸アッセイ(mRNA)、発現したタンパク質レベルのアッセイ、または経路(例えば、シグナル経路)に関連する付随化合物のアッセイを含む。さらに、シグナル経路に反応して上方制御または下方制御される遺伝子の発現もまた、アッセイされ得る。
1つの実施態様は、興味ある遺伝子(単数または複数)の制御領域に、操作可能に結合しているレポーター遺伝子(ルシフェラーゼなど)を含む。
遺伝子発現の調節因子は、1つの実施態様では、細胞が候補化合物または候補薬と接触された場合に同定されることができ、mRNAの発現が判定される。候補化合物または候補薬の存在下でのmRNAの発現レベルは、当該化合物または薬剤の不存在下での発現レベルと比較される。当該比較に基づき、乳癌の治療のための候補化合物または候補薬剤は、変異遺伝子の遺伝子発現を調節するものとして同定され得る。候補化合物または候補薬の存在下で、その不存在下よりも、mRNAまたはコード化タンパク質の発現が統計的に有意に大きい場合、候補化合物または候補薬は、核酸の発現の刺激剤または核酸の上方制御因子として同定される。候補化合物または候補薬の存在下で、その不存在下よりも、核酸の発現またはタンパク質レベルが統計的に有意に低い場合、候補化合物は、核酸の発現の阻害剤または下方制御因子として同定される。
本発明は、さらに、遺伝子の修飾因子(すなわち、遺伝子発現の刺激剤および/または阻害剤)としての薬剤(化合物および/または薬剤)スクリーニングを通じて同定される化合物を使用した治療方法を提供する。
(治療薬に対する反応の可能性の評価方法、治療の進展をモニターする方法および乳癌を治療する方法)
当該技術分野で公知のように、個体は、特定の治療(例えば、治療薬または治療方法、)に対する反応差を有しうる。反応差の基盤は、部分的に遺伝的に判定されてもよい。薬理ゲノミクスは、変化した薬剤処分および/または薬剤の異常な作用もしくは変化した作用によって、遺伝的変異(例えば、本発明の変異体(マーカーおよび/またはハプロタイプ))がどのように薬剤反応に影響するか、という問題点について取り組んでいる。従って、反応差の基盤は部分的に遺伝的に判定されてもよい。薬剤反応に影響する遺伝的変異に起因する臨床的成果は、ある個体(例えば、本発明の遺伝的変異の保有者または非保有者)における薬剤毒性、または当該薬剤の治療不全をもたらすかも知れない。従って、本発明の変異は、治療薬および/または方法が、身体に作用する様式、または身体が治療薬を代謝する方法を判定してもよい。
従って、1つの実施態様では、多形性部位またはハプロタイプの特定の対立遺伝子の存在は、特定の治療様式に対する異なる反応の速度を示す。これは、乳癌と診断され、本発明の、多型における特定の対立遺伝子またはハプロタイプ(例えば、本発明の、リスクがありかつ保護的な対立遺伝子および/またはハプロタイプ)を有する患者は、疾病の治療に使用される、特定の治療上の薬剤および/または他の治療に対して、より良好に、または悪化して反応することを意味する。従って、マーカー対立遺伝子またはハプロタイプの存在または不存在は、患者に対して使用されるべき治療の決定の助けとなり得る。例えば、新規に診断された患者について、本発明のマーカーまたはハプロタイプの存在が(例えば、本願明細書記載のように、血液試料由来のDNAの試験を通じて)評価されてもよい。患者が、マーカー対立遺伝子またはハプロタイプに対して陽性である場合(つまり、マーカーの少なくとも1つの特定の対立遺伝子、またはハプロタイプが存在している)、医師は、1つの特定の治療方法を推奨し、一方、患者がマーカーの少なくとも1つの対立遺伝子、またはハプロタイプに陰性である場合、異なるコースの治療方法が推奨されてもよい(疾病の進行の連続的なモニター以外は、緊急ではない治療方法が行われることを推奨することを含んでいてもよい)。従って、患者のキャリア状態は、特定の治療様式が施されるべきかどうかを判定するのを補助するために使用され得る。その価値は、最も適切な治療を適用できるようにするため、早期の段階で疾病を診断でき、最も適切な治療を選択でき、予後診断/疾病の悪性度について臨床医に情報を提供できる可能性の中にある。
さらに本願明細書に記載のように、乳癌の現在の臨床予防的選択肢は、主に化学予防(化学療法、またはホルモン治療方法)および予防的手術である。最も一般的な化学予防は、タモキシフェンおよびラロキシフェンである。他の選択肢は、他の選択的エストロゲン受容体修飾因子(SERM)およびアロマターゼ阻害剤を含む。治療上の選択肢はまた、一部の患者が有害な症候を経験する放射線療法を含む。本発明のマーカーは、本願明細書記載のように、これらの治療上の選択肢に対する反応を評価するため、または、これらの治療上の選択肢のいずれか1つを使用した治療方法の進行を予測するために使用されてもよい。従って、遺伝的鑑定は、個体の遺伝的状態に基づいた適切な治療戦略の選択に使用され得、または特定の治療の選択肢の成果の予測に使用されてもよく、従って、治療上の選択肢または利用可能な治療上の選択肢の組み合わせの戦略的選択について有用であり得る。
本発明はまた、乳癌の治療の進行または有効性をモニターする方法に関する。これは、本発明のマーカーおよびハプロタイプの遺伝子型および/またはハプロタイプの状態に基づいて行われ得、すなわち、本願明細書で開示された少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の不存在または存在の評価、または本発明の変異体(マーカーおよびハプロタイプ)に関連する遺伝子の発現のモニターによってなされ得る。リスク遺伝子のmRNAまたはコードされたポリペプチドは、組織試料(例えば、抹消血試料、または生検試料)において測定され得る。従って、発現レベルおよび/またはmRNAレベルは、その有効性をモニターするために、治療の前および治療の間に判定され得る。代わりに、または同時に、本願明細書に示された乳癌の少なくとも1つのリスク変異の遺伝子型および/またはハプロタイプの状態は、その有効性をモニターするために、治療の前および治療の間に判定される。
あるいは、本発明のマーカーおよびハプロタイプに関連する生物学的ネットワークまたは代謝経路は、mRNAおよび/またはポリペプチドレベルの測定によってモニターされ得る。例えば、これは、治療前および治療後に得られた試料中の、ネットワークおよび/または経路に属するいくつかの遺伝子について、発現レベルまたはポリペプチドをモニターすることによってなされ得る。あるいは、生物学的ネットワークまたは代謝経路に属する代謝物を、治療前および治療後に測定してもよい。治療の有効性は、治療の間に、発現レベル/代謝物レベルで認められた変化を、健康な被験者から得た対応するデータと比較することによって判定される。
さらなる態様では、本発明のマーカーは、臨床試験の効力および有効性を増加するために使用され得る。従って、本発明のリスクのある変異の保有者である個体、すなわち、乳癌の発生について増加したリスクを与える少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の保有者である個体は、特定の治療様式に対し、より反応する可能性があってもよい。1つの実施態様では、特定の治療(例えば、小分子薬剤)が標的にしている経路および/または代謝ネットワークの遺伝子(単数または複数)についてリスクのある変異を保有する個体は、当該治療に対してより反応する可能性がある。別の実施態様では、発現および/または機能がリスクのある変異によって変化された遺伝子についてリスクのある変異を保有する個体は、その遺伝子、その発現またはその遺伝子産物を標的とした治療様式に対してより反応する可能性がある。
さらなる態様では、本発明のマーカーおよびハプロタイプは、特定の個体の医薬品の選択のターゲティングに使用され得る。治療様式の個別化された選択、生活習慣の変化、またはこれら2つの組み合わせは、本発明のリスクのある変異体の利用によって実現され得る。従って、本発明の特定のマーカーについての個体の状態の知識は、本発明のリスクのある変異によって影響される遺伝子または遺伝子産物を標的にする、治療上の選択肢の選択について有用であり得る。変異の特定の組み合わせは、治療上の選択肢の1つの選択に適してもよく、一方で他の遺伝子変異の組み合わせは他の治療上の選択肢を標的としてよい。治療要素の選択を臨床的に信頼できる正確性をもって決定するために必要に応じて、このような変異の組み合わせは、1つの変異、2つの変異、3つの変異、または4つ以上の変異を含んでもよい。
(コンピューターで実施される態様)
本発明はまた、乳癌に関連すると本願明細書に記載された多型マーカーおよびハプロタイプのコンピューターで実施される適用に関する。このような適用は、本願明細書記載のように、本発明の方法に有用な遺伝子型のデータの保存、操作またはその他の分析に有用であり得る。1つの実施例は、遺伝子型の情報を第三者に提供することができるようにするための、可読媒体上への個体由来の遺伝子型の情報の保存に関する。当該第三者は、その遺伝子型のデータが由来する個体であってもよい。第三者はまた、遺伝子型情報を分析するためのサービス提供者、例えば、特定の遺伝子マーカーについての個体の遺伝子型に基づき遺伝的危険率を算出するサービス提供者であってもよい。このような実施態様の1つでは、当該サービス提供者は、遺伝子型サービス提供者から遺伝子型情報を入手し、引き続く分析のために、当該遺伝子型情報を可読媒体上に保存する。別の実施態様では、当該遺伝子型提供者はまた当該サービス提供者であり、すなわち、同一の団体が個体から得たDNA試料から遺伝子型を生じ、可読媒体上の遺伝子型データ、および当該遺伝子型データのリスクアセスメントまたは他の解釈に関連する提供者のサービスを保存する。さらなる解釈には、例えば、当該個体の系統の評価もしくは予測、または当該個体と参照個体との間の系統学上の関連性を含めてもよい。当該参照個体は、例えば、友人、親戚または当該個体がその遺伝子型と比較することを望むいずれの他のヒトであってもよい。1つの特定の実施態様では、当該遺伝子型データは、増加した乳癌に対する感受性に寄与する遺伝的危険因子についての情報を導き、かつ、そのような比較に基づく結果を報告するために使用される。
このような1つの態様は、コンピューター可読媒体に関する。一般的な用語には、このような媒体は、(i)少なくとも1つの多型マーカーまたはハプロタイプの識別子の情報、(ii)乳癌の個体における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、および参照集団における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、を保存する性能を有する。当該参照集団は、個体の疾病フリーの集団であり得る。あるいは、当該参照集団は、一般的な集団から得た確率標本であり、従って、集団全体を代表する。頻度の指標は、算出された頻度、対立遺伝子および/またはハプロタイプのコピー数、または、特定の媒体に適した実際の頻度の規準化された値もしくは別の態様で操作された値であってもよい。
当該個体についてのさらなる情報(系統の情報、性別についての情報、身体的な特質もしくは特徴(身長および体重を含む)、生化学的測定(例えば、血圧、血中脂質レベル液など)、または特定の個体の遺伝子型の状態に関連して保存または操作することが望ましい他の有用な情報など)が、媒体上に保存され得る。
本発明は、さらに、ヒト個体の乳癌に対する感受性を判定するのに有用な遺伝的データの判定または操作に適した装置に関する。このような装置は、コンピューター可読メモリ、コンピューター可読メモリ上に保存されたデータの操作のためのルーチン、および遺伝的データの判定を含む結果を生じるためのルーチンを含み得る。このような判定は、対立遺伝子の頻度もしくはハプロタイプの頻度、遺伝子型数、性別、年齢、表現型の情報、オッズ比(OR)の値もしくは相対リスク(RR)の値、集団に起因するリスク(PAR)、または本来の遺伝子型のデータの直接の統計量もしくは遺伝的データに基づく算出に基づくもののいずれかの他の有用な情報、などの値を含み得る。
本願明細書で、乳癌の増加した感受性(例えば、増加したリスク)に関連すると示されたマーカーおよびハプロタイプは、ある実施態様では、遺伝子型のデータの解釈および/または分析に有用である。従って、ある実施態様では、本願明細書で示された、乳癌のリスクのある対立遺伝子、または本願明細書で、乳癌に関連すると示されたマーカーのいずれか1つとLDである多型マーカーの対立遺伝子の同定は、遺伝子型のデータの由来である個体が乳癌について増加したリスクを有することを示す。そのような1つの実施態様では、遺伝子型のデータは、本願明細書で乳癌に関連すると示された少なくとも1つの多型マーカー、またはそれらと連鎖不平衡のマーカーについて生じる。当該遺伝子型のデータは、例えば、インターネットに接続可能なユーザーインターフェースを介して、当該遺伝子型のデータの解釈とともに、例えば、疾病(例えば、乳癌)についてのリスク測定(絶対的なリスク(AR)、リスク比(RR)またはオッズ比(OR)など)の形態で、その後に、当該データの由来である個体に利用可能となる。別の実施態様では、個体由来の遺伝子型のデータセットで同定されたリスクのあるマーカーが評価され、当該データセットにおけるこのようなリスクのある変異体の存在によって与えられるリスク評価から得た結果は、例えば、安全なウェブインターフェースを介して、または他の伝達手段によって当該個体に利用可能となる。このようなリスクアセスメントの結果は、数値的な形態(例えば、絶対的なリスク、相対リスク、および/もしくはオッズ比などのリスク値、または参照と比較したリスクの増加した割合による)、図面による方法、または当該遺伝子型のデータの由来である個体のリスクを図解するのに適した他の手段で報告され得る。特定の実施態様では、リスクアセスメントの結果は、第三者(例えば、医師、他の医療従事者または遺伝的カウンセラー)に利用可能となる。
(本発明の様々な態様において有用なマーカー)
上述の適用は、全て、乳癌に対する感受性の評価の方法についてより詳細に記載される、本発明のマーカーおよびハプロタイプを用いて行われ得る。従って、これらの適用は、一般的に、本願明細書で定義されるChr5p12およびChr10q26ゲノムの領域内のマーカー(表12、13および14に記載されるマーカー、ならびにそれらと連鎖不平衡のマーカーを含む)を使用して、実行に移し得る。1つの実施態様では、本発明の様々な態様および実施態様において有用なマーカーは、表12、13および14に記載されるマーカー(配列番号1〜237)から選択される。1つの実施態様では、当該マーカーは、マーカーrs10941679、rs7703618、rs4415084、rs2067980、rs10035564、rs11743392、rs7716600、およびrs1219648、ならびにそれらと連鎖不平衡のマーカーから選択される。別の実施態様では、当該マーカーは、マーカーrs10941679、rs7703618、rs4415084、rs2067980、rs10035564、rs11743392、rs7716600およびrs1219648から選択される。別の実施態様では、当該マーカーは、rs10941679、およびそれらと連鎖不平衡のマーカーから選択される。1つの実施態様では、当該マーカーは、表13に記載されるマーカーから選択される。別の実施態様では、当該マーカーは、マーカーrs4415084、およびそれらと連鎖不平衡のマーカーから選択される。別の実施態様では、当該マーカーは、表12に記載されるマーカーから選択される。別の実施態様では、当該マーカーは、マーカーrs1219648、およびそれらと連鎖不平衡のマーカーから選択される。別の実施態様では、当該マーカーは、表14に記載されるマーカーから選択される。別の実施態様では、当該マーカーは、rs4415084である。別の実施態様では、当該マーカーは、rs10941679である。別の実施態様では、当該マーカーは、rs1219648である。別の実施態様では、当該マーカーは、rs4415084またはrs10941679である。別の実施態様では、乳癌の増加したリスクまたは感受性(suscepbitility)を与えるマーカー対立遺伝子は、rs10941679 対立遺伝子G、rs7703618 対立遺伝子T、rs4415084 対立遺伝子G、rs2067980 対立遺伝子G、rs10035564 対立遺伝子G、rs11743392 対立遺伝子T、rs7716600 対立遺伝子 A、およびrs1219648 対立遺伝子Gから選択される。
(核酸およびポリペプチド)
本願明細書記載の核酸およびポリペプチドは、上記に記載のように、本発明の方法およびキットで使用され得る。「単離された」核酸分子は、本願明細書で使用されるように、(ゲノム配列における)遺伝子またはヌクレオチド配列に通常に隣接した核酸から分離されたもの、および/または、(例えば、RNAライブラリーにおける)他の転写された配列から完全にもしくは部分的に精製したものである。例えば、本発明の単離された核酸は、自然に生じる複雑な細胞環境、または組み換え技術によって産生された場合の培養培地、または化学的に合成された場合の化学的前駆体または他の化学物質に対して実質的に単離され得る。いくつかの例では、単離された物質は、組成物(例えば、他の物質を含む粗抽出物)、バッファーシステムまたは試薬混合物の一部を形成するだろう。他の環境では、当該物質は、例えば、ポリアクリルアミドゲル電気泳動(PAGE)またはカラムクロマトグラフィー(例えば、HPLC)によって判定されるように、基本的に均一に精製され得る。本発明の単離された核酸分子は、存在する全ての高分子の種のうち、少なくとも約50%、少なくとも約80%または少なくとも約90%(モルベースによる)を構成し得る。ゲノムDNAに関しては、用語「単された」はまた、当該ゲノムDNAが本来関連する染色体から分離される核酸分子も意味し得る。例えば、単離した核酸分子は、約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kbまたは0.1kb未満の、当該核酸分子が由来する細胞のゲノムDNAの核酸分子に隣接するヌクレオチドを含み得る。
当該核酸分子は、他のコード配列または制御配列に融合され得、依然として単離されたものとみなされ得る。従って、ベクターに包含された組み換えDNAは、本願明細書で使用される「単離された」の定義に含まれる。また、単離された核酸分子は、異種の宿主細胞もしくは異種生命体中の組み換えDNA分子、および部分的にもしくは実質的に精製された溶液中のDNA分子を含む。「単離された」核酸分子はまた、in vivoおよびin vitroでの本発明のDNA分子のRNA転写物を含む。単離した核酸分子またはヌクレオチド配列は、化学的に合成された、または組み換え手段によって合成された核酸分子またはヌクレオチド配列を含み得る。このような単離されたヌクレオチド配列は、例えば、コードされたポリペプチドの製造、(例えば、他の哺乳類の種からの)相同配列の単離のため、(例えば、染色体とのインサイツハイブリダイゼーションによる)遺伝子マッピングのため、または組織(例えば、ヒト組織)中の遺伝子発現の検出(ノーザンブロット分析または他のハイブリダイゼーション技術などによる)のためのプローブとして有用である。
本発明はまた、高いストリンジェンシーハイブリダイゼーション条件下(選択的ハイブリダイゼーションなど)で、本願明細書記載のヌクレオチド配列(例えば、本願明細書記載のマーカーまたはハプロタイプに関連する多形性部位を含むヌクレオチド配列に特異的にハイブリダイズする核酸分子)にハイブリダイズする核酸分子に関する。このような核酸分子は、(例えば、高いストリンジェンシー条件下での)対立遺伝子特異的なハイブリダイゼーションまたは配列特異的なハイブリダイゼーションによって検出および/または単離され得る。核酸ハイブリダイゼーションのストリンジェンシー条件および方法は、当業者に周知(例えば、Current Protocols in Molecular Biology、Ausubel、F.ら、John Wiley&Sons、(1998)、およびKraus、M.およびAaronson、S.、Methods Enzymol.、200:546〜556(1991)を参照、その全体の教示は参照によって本願明細書に援用する)である。
2つのヌクレオチドまたはアミノ酸配列の同一性(%)は、至適な比較目的で配列を整列することによって判定され得る(例えば、間隙は、第1の配列の配列に導入され得る)。対応する位置のヌクレオチドまたはアミノ酸は、次いで、比較され、2つの配列間の同一性は、当該配列によって共有される同一の位置の数の関数である(すなわち、同一性(%)=同一の位置の数/位置の総数×100)。ある実施態様では、比較目的で整列させた配列の長さは、参照配列の長さのうち、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つの配列の実際の比較は、周知の方法、例えば、数学的アルゴリズムを使用することによって達成され得る。このような数学的アルゴリズムの非限定的な例は、Karlin、S.およびAltschul、S.、Proc.Natl.Acad.Sci.USA、90:5873〜5877(1993)に記載される。このようなアルゴリズムは、Altschul S.ら、Nucleic Acids Res.、25:3389〜3402(1997)に記載されるように、NBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に取り込まれる。BLASTプログラムおよびGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、NBLAST)の初期状態のパラメータが使用され得る。ワールドワイドウェブ(ncbi.nlm.nih.gov.)上のウェブサイトを参照。1つの実施態様では、配列比較のパラメータはスコア=100、語長=12に設定し得るし、または、異なり得る(例えば、W=5またはW=20)。
他の例は、MyersおよびMiller、CABIOS(1989)のアルゴリズム、Torellis A.およびRobotti C.、Comput.Appl.Biosci.10:3〜5(1994)に記載されたADVANCEおよびADAM、およびPearson W.およびLipman、D.、Proc.Natl.Acad.Sci.USA、85:2444〜48(1988)に記載されたFASTAを含む。
別の実施態様では、2つのアミノ酸配列間の同一性は、GCGソフトウェアパッケージ(アクセルリス(Accelrys)、英国、ケンブリッジ)におけるGAPプログラムを使用して達成され得る。
本発明はまた、高度にストリンジェントな条件下で、表12、表13および表14(配列番号1〜237)に記載された多型マーカーを含むヌクレオチド配列、ならびにFGF10、MRPS30、HCN1およびFGFR2遺伝子のヌクレオチド配列、または表12、表13および表14(配列番号1〜237)に記載された多型マーカーを含むヌクレオチド配列のヌクレオチド配列の補完物を含む(またはこれらから構成される)ヌクレオチド配列、ならびにFGF10、MRPS30、HCN1およびFGFR2遺伝子のヌクレオチド配列、を含む(またはこれらから構成される)核酸にハイブリダイズする断片または部分を含む、単離した核酸分子を提供し、当該ヌクレオチド配列は本願明細書記載のマーカーおよびハプロタイプに含まれる少なくとも1つの多型の対立遺伝子を含む。本発明の核酸断片は、長さが少なくとも約15、少なくとも約18、20、23または25ヌクレオチドであり、30、40、50、100、200、500、1000、10,000以上のヌクレオチドであり得る。
本発明の核酸断片は、本願明細書記載のようなアッセイにおけるプローブまたはプライマーとして使用される。「プローブ」または「プライマー」は、塩基特異的様式で核酸分子の相補鎖にハイブリダイズする、オリゴヌクレオチドである。DNAおよびRNAに加えて、このようなプローブおよびプライマーは、Nielsen P.ら、Science 254:1497〜1500(1991)において記載されたように、ポリペプチド核酸(PNA)を含む。プローブまたはプライマーは、核酸分子の少なくとも約15、典型的には約20〜25、およびある実施態様では約40、50または75の、核酸分子の連続的ヌクレオチドにハイブリダイズするヌクレオチド配列領域を含む。1つの実施態様では、当該プローブまたはプライマーは、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子もしくは本願明細書記載の少なくとも1つのハプロタイプ、またはその補完物を含む。特定の実施態様では、プローブまたはプライマーは、100またはより少ないヌクレオチド(例えば、ある実施態様では、6〜50ヌクレオチド、または、例えば、12〜30ヌクレオチド)を含み得る。他の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列もしくは当該近接するヌクレオチド配列の補完物と、少なくとも70%の同一性、少なくとも80%の同一性、少なくとも85%の同一性、少なくとも90%の同一性、または少なくとも95%の同一性である。別の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列または当該近接するヌクレオチド配列の補完物に、選択的にハイブリダイズできる。しばしば、当該プローブまたはプライマーは、さらに、標識(例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識)を含む。
上記などの本発明の核酸分子は、当業者に周知の標準的な分子生物学技術を使用して同定され、単離され得る。増幅したDNAは、標識(例えば、放射標識)され得、ヒト細胞由来のcDNAライブラリーのスクリーニングのためのプローブとして使用され得る。cDNAは、mRNA由来であり得、適したベクター中に含まれ得る。対応するクローンが単離され得、DNAはin vivoでの切除の後に得ることができ、クローン化された挿入断片は、一方向または両方向で、当該技術分野で承認されている方法によって、適切な分子量のポリペプチドをコードする正しい読み枠を同定し、配列決定され得る。これらの方法または同様の方法を使用して、ポリペプチドおよびポリペプチドをコードするDNAは単離され、配列決定され、さらに特徴付けられ得る。
通常は、本発明の単離された核酸配列は、サザンゲル上の分子量マーカーとして、および関連する遺伝子の位置をマッピングするために標識された染色体マーカーとして使用され得る。当該核酸配列はまた、乳癌または乳癌に対する感受性を同定するため、患者の内在性DNA配列と比較するために使用され得、プローブとして、ハイブリダイズし、関連するDNA配列を発見するためなどに使用され得、または試料から公知の配列を引くために使用され得る(例えば、サブトラクティブなハイブリダイゼーション)。当該核酸配列は、さらに、遺伝的フィンガープリントのためのプライマーを得るために使用され得、免疫技術を使用して抗ポリペプチド抗体を産生させるために使用され得、および/または抗DNA抗体を産生させるために、もしくは免疫反応を誘発するために抗原として使用され得る。
(抗体)
遺伝子産物の形態の1つに特異的に結合するが、遺伝子産物の他の形態には結合しないポリクローナル抗体および/またはモノクローナル抗体もまた、提供される。多形成部位(単数又は複数)を含む、変異体または参照遺伝子産物のいずれかの一部に結合する抗体もまた、提供される。用語「抗体」は、本願明細書で使用されるように、免疫グロブリン分子および免疫グロブリン分子の免疫学的に活性な部分、すなわち、特異的に抗原に結合する抗原結合部位を含む分子を意味する。本発明のポリペプチドに特異的に結合する分子は、そのポリペプチドまたはその断片に結合するが、試料中の他の分子、例えば、自然に当該ポリペプチドを含む生物学的試料には実質的に結合しない分子である。免疫グロブリン分子の免疫学的に活性な部分の例は、抗体をペプシンなどの酵素で処理することによって生じ得るF(ab)およびF(ab’)2断片を含む。本発明は、本発明のポリペプチドに結合するポリクローナル抗体およびモノクローナル抗体を提供する。用語「モノクローナル抗体」または「モノクローナル抗体の組成物」は、本願明細書で使用されるように、本発明のポリペプチドの特定のエピトープと免疫反応できる1種のみの抗原結合部位を含む抗体分子の集団を意味する。従って、モノクローナル抗体の組成物は、典型的には、免疫反応する本発明の特定のポリペプチドに対する単一の結合アフィニティーを示す。
ポリクローナル抗体は、適した被験者に、所望の免疫原(例えば、本発明のポリペプチドまたはその断片)で免疫することによって、上記のように、調製され得る。免疫された被験者における抗体力価は、酵素結合免疫吸着検定法(ELISA)などの標準的な技術によって、固定化されたポリペプチドを使用して、経時的にモニターされ得る。所望であれば、ポリペプチドに対して作られた抗体分子は、哺乳類から(例えば、血液から)単離され得、さらに、IgG分画を得るために、プロテインAクロマトグラフィーなどの周知の技術によって精製され得る。免疫後の適切な時期に、例えば、抗体力価が最も高い場合に、抗体産生細胞が被験者から入手され、標準的な技術(KohlerおよびMilstein、Nature 256:495〜497(1975)に最初に記載された融合細胞法、ヒトB細胞の融合細胞法(Kozborら、Immunol.Today 4: 72(1983))、EBV融合細胞法(Coleら、Monoclonal Antibodies and Cancer Therapy、Alan R.Liss、1985、Inc.、77〜96頁)またはトリオーマ(trioma)法、など)によってモノクローナル抗体を調製するために使用され得る。融合細胞を産生する技術は周知である(概括的に、Current Protocols in Immunology(1994)Coliganら、(編集)John Wiley&Sons社、New York、NY参照)。簡潔に言えば、不死の株化細胞(典型的にはミエロ−マ)は、上記の免疫原で免疫された哺乳類から得たリンパ球(典型的には脾細胞)と融合され、得られた融合細胞の培養上清は、本発明のポリペプチドに結合するモノクローナル抗体を産生する融合細胞を同定するためにスクリーニングされる。
リンパ球および不死化株化細胞を融合するために使用される多くの周知の手順のいずれも、本発明のポリペプチドに対するモノクローナル抗体を生じる目的で適用され得る(例えば、Current Protocols in Immunology、supra;Galfreら、Nature 266:55052(1977);R.H.Kenneth、in Monoclonal Antibodies:A New Dimension In Biological Analyses、Plenum Publishing Corp.、New York、New York(1980);およびLerner、Yale J.Biol.Med.54:387〜402(1981)参照)。さらに、当業者は、同様に有用であるこのような方法の多くのバリエーションがあることを理解するだろう。
モノクローナル抗体分泌融合細胞の調製の代わりに、本発明のポリペプチドに対するモノクローナル抗体が、当該ポリペプチドとの組み換えコンビナトリアル免疫グロブリンライブラリー(例えば、抗体ファージディスプレイライブラリー)をスクリーニングし、それにより、当該ポリペプチドに結合する免疫グロブリンライブラリーメンバーを単離することによって、同定および単離され得る。ファージディスプレイライブラリーを生じ、かつスクリーニングするためのキットは、市販されている(例えば、ファルマシア社(Pharmacia)組み換えファージ抗体システム、カタログ番号27−9400−01;およびストラタジーン社(Stratagene)Sur/ZAP(商標)ファージディスプレイキット、カタログ番号240612)。その上、方法および試薬の例、特に、抗体のディスプレイライブラリーの生成およびスクリーニングにおける使用において受け入れられる例は、例えば、米国特許第5,223,409号明細書、国際公開第92/18619号パンフレット、国際公開第91/17271号パンフレット、国際公開第92/20791号パンフレット、国際公開第92/15679号パンフレット、国際公開第93/01288号パンフレット、国際公開第92/01047号パンフレット、国際公開第92/09690号パンフレット、国際公開第90/02809号パンフレット;Fuchsら、Bio/Technology 9:1370〜1372(1991);Hayら、Hum.Antibod.Hybridomas 3:81〜85(1992);Huseら、Science 246:1275〜1281(1989);およびGriffithsら、EMBO J.12:725〜734(1993)において見出される。
その上、ヒト部分および非ヒト部分の両方を含み、標準的な組み換えDNA技術を使用して産生され得る組み換え抗体(キメラのモノクローナル抗体およびヒト化モノクローナル抗体など)は、本発明の範囲内である。このようなキメラのモノクローナル抗体およびヒト化モノクローナル抗体は、当該技術分野で公知の組み換えDNA技術によって産生され得る。
通常は、本発明の抗体(例えば、モノクローナル抗体)は、標準的な技術(アフィニティークロマトグラフィーまたは免疫沈降など)によって本発明のポリペプチドを単離するのに使用され得る。ポリペプチド特異的な抗体は、細胞からの自然のポリペプチドの精製および宿主細胞で発現した組み換えによって産生されたポリペプチドの精製を促進できる。さらに、本発明のポリペプチドに特異的な抗体は、当該ポリペプチドの存在量および発現様式を評価するために、(例えば、細胞溶解物、細胞上清、または組織試料中の)ポリペプチドを検出するのに使用され得る。抗体は、臨床試験過程の一部として、例えば、所定の治療計画の有効性の判定などのため、組織中のタンパク質レベルをモニターするために診断的に使用され得る。抗体は、その検出を促進するための検出可能な物質と結合され得る。検出可能な物質の例は、様々な酵素、補欠分子族、蛍光物質、発光物質、生物発光物質、および放射性物質を含む。適した酵素の例は、西洋わさびペルオキシダーゼ、アルカリホスファターゼ、βガラクトシダーゼ、またはアセチルコリンエステラーゼを含む。適した補欠分子族複合体の例は、ストレプトアビジン/ビオチンおよびアビジン/ビオチンを含む。適した蛍光物質の例は、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアネート、ローダミン、ジクロロトリアジニルアミンフルオレセイン(dichlorotriazinylamine fluorescein)、塩化ダンシルまたはフィコエリトリンを含む。発光物質の例は、ルミノールを含む。生物発光物質の例は、ルシフェラーゼ、ルシフェリン、およびエクオリンを含み、ならびに、適した放射性物質の例は125I、131I、35Sまたは3Hを含む。
抗体はまた、薬理ゲノミクス分析において有用であってもよい。このような実施態様では、本発明に関する核酸によってコードされた変異タンパク質に対する抗体(少なくとも1つの本発明の多型マーカーを含む核酸によってコードされた変異タンパク質など)は、改変された治療様式を必要とする個体の同定のために使用され得る。
抗体は、さらに、疾病の活性段階などの疾病の状態、または特定の乳癌におけるタンパク質の機能に関連した疾病に対する素因のある個体における変異タンパク質の発現の評価のために有用であり得る。本願明細書記載の少なくとも1つの多型マーカーまたはハプロタイプを含む核酸によってコードされた本発明の変異タンパク質に特異的な抗体は、変異タンパク質の存在のスクリーニング、例えば、変異タンパク質の存在によって示された乳癌への素因についてのスクリーニング、に使用され得る。
抗体は他の方法で使用し得る。従って、抗体は、電気泳動の移動度、等電点、トリプシンまたは他のプロテアーゼ消化による分析と組み合わせて、タンパク質(本発明の変異タンパク質など)を評価するための診断の手段として、または当業者に知られた他の物理的なアッセイにおける使用において有用である。抗体はまた、組織適合試験に使用してもよい。そのような1つの実施態様では、特異的な変異タンパク質は、特定の組織型の発現に関連し、変異タンパク質に特異的な抗体は、次いで、特定の組織型の同定に使用され得る。
変異タンパク質を含むタンパク質の細胞内局在はまた、抗体を使用して判定され得、様々な組織の細胞のタンパク質の異常な細胞内局在を評価するために適用され得る。このような使用は遺伝子検査に適用され得るが、特定の治療様式をモニターすることにも適用され得る。治療が、変異タンパク質または変異タンパク質の異常な組織分布もしくは発生上の発現についての、発現レベルまたは存在を矯正することを目的にしている場合、当該変異タンパク質またはその断片に特異的な抗体は治療効果をモニターするために使用され得る。
抗体は、さらに、例えば、結合分子またはパートナーへの、変異タンパク質の結合をブロックすることによる変異タンパク質の機能の阻害において有用である。このような使用はまた、治療が変異タンパク質の機能の阻害に関連する治療上の構成においても適用され得る。抗体は、例えば、結合をブロックまたは競合的に阻害し、それによりタンパク質の活性を調節(すなわち、刺激または拮抗)するのに使用され得る。抗体は、特定の機能に必要とされる部位を含む特定のタンパク質断片、または、細胞または細胞膜に関連するインタクトなタンパク質に対して調製され得る。in vivoにおける投与について、抗体はさらなる治療上の負荷量(放射性核種、酵素、免疫原性エピトープ、または細菌毒素(ジフテリアまたは、リシンなどの植物毒素)を含む細胞毒など)に関連してもよい。in vivoでの抗体またはその断片の半減期は、ポリエチレングリコールとの結合によるペグ化によって増加されてもよい。
本発明は、さらに、本願明細書記載の方法における抗体を使用するためのキットに関する。これは、試験試料における変異タンパク質の存在を検出するためのキットを含むが、これに限定されない。1つの好ましい実施態様は、抗体(標識された抗体または標識できる抗体など)および生物学的試料中の変異タンパク質を検出するための化合物もしくは薬剤、試料中の変異タンパク質の量もしくは存在および/もしくは不存在を判定する手段、ならびに試料中の変異タンパク質の量を標準物質と比較する手段、ならびに当該キットの使用についての説明書を含む。
本発明は、これから下記の非限定的な実施例によって例証される。
(実施例1 乳癌のリスクに関連する染色体5p12上の変異体の同定)
(緒言)
乳癌感受性遺伝子BRCA1およびBRCA2の変異は、乳癌リスクの家族性要素の15〜25%を説明する(Easton、(1999)、Breast Cancer Res、1、14−7;Balmainら、(2003)、Nat Genet、33 Suppl、238〜44)。乳癌のリスクの遺伝的要素の多くは、未同定のままであり、(個々に、非常に一般的であるかも知れない)より少ない浸透性の変異体の組み合わせから生じると考えられている(Pharoahら、(2002)、Nat Genet、31、33〜6)。より少ない浸透性の乳癌リスク変異体についての多くの検索は、候補遺伝子、症例対照の関連アプローチを使用して行われてきた。これらの研究から得た知見は、しばしば、再現することが困難であることが証明されてきた(Breast Cancer Association、(2006)、J Natl Cancer Inst、98、1382〜96)。近年、2つの遺伝子(CASP8およびTGFB1)における、共通のミスセンス変異体は、高い検出力の多施設解析(well−powered、multi−center analyses)の使用によって、乳癌リスクと関連することが示されてきた(Coxら、(2007)、Nat Genet、39、352〜8)。これらの報告は、目的が乳癌のリスクの中程度の増加を与える共通の変異体を同定することである場合の、大規模な研究と適切な再現の重要性を強調している。
(結果)
(染色体5p12上の領域の多数のイルミナSNPは、アイスランドにおける乳癌の増加したリスクと関連している)
乳癌の感受性に関連している、共通のSNPの対立遺伝子について広く検索するため、発明者らは、イルミナ ヒトHap300マイクロアレイ技術を使用して、ゲノム全体でのSNP関連研究を行った。遺伝子型の同定は、約1,600のアイスランド人の乳癌患者および11,563の対照について行った。この発見試料セットを、「アイスランド1」と命名した。品質管理チェックに通らなかったSNPを除いた後、311,524のSNPが残り、これらを乳癌との関連について試験した。この結果は、ゲノムの制御方法を使用して、個体間の関連性および潜在的な集団の層別化について調整された(DevlinおよびRoeder、(1999)、Biometrics、55、997〜1004)(方法の項を参照)。シグナルは、P値によって順位付けした。染色体5p12上の同一の領域から得たSNPのセットは、上位50のうち39を占めた。5p12に位置するSNPによって占められた最も高い順位は、5位から9位であった。これらのSNPを含む興味ある領域は、染色体5近辺の座標44,094,392bp(マーカーrs7704166の位置;本願明細書の全ての座標は、NCBI ビルド34におけるものである)から、セントロメアの前の最後のイルミナ SNPの位置(すなわち46,393,984bpにおけるrs10941803)に及ぶ。この領域のイルミナ SNPの遺伝子型の同定から得た結果は、表1に示され、図1に図示されている。
高順位のSNPの1つである、chr5p12上のマーカーrs7703618に関連するシグナルをさらに検討するため、発明者らは、このSNPについて、ケンタウルス(Centaurus)アッセイを作製し、検証した。当該ケンタウルスアッセイをSG05S3065.c1と命名した。当該SNPアッセイは、約591のアイスランド人の乳癌患者および1314の対照の別個の試料の遺伝子型を同定するために使用した。この別個の試料を、アイスランド2と命名した。表2に示されるように、当該SNPは、アイスランド2試料における乳癌との明らかな関連を示し、アイスランド1についての当初の知見を確認した。従って、発明者らは、アイスランド1の試料において観察された当初の発見を、別個のアイスランド2の試料で再現した。アイスランド1およびアイスランド2について合わせたP値は、試験された311,524のSNPについて保守的なボンフェローニ補正を適用した後に、ゲノム全体で有意と考えられ得るレベルに近づいた(Skolら、(2006)、Nat Genet、38、209〜13)。
(CGEMSデータにおいて確認された、染色体5p12との関連は、CGEMSを用いた共同解析の後、ゲノム全体で有意である)
米国国立癌研究所の感受性の癌遺伝子マーカー(CGEMS)計画は、イルミナプラットフォームを使用した約530,000のSNPで遺伝子型を同定された1145の患者および1142の対照に基づく乳癌の感受性についてのゲノム全体でのSNPの関連研究について公共にデータを公開している。これらのデータは、https://caintegrator.nci.nih.gov/cgems/で入手できる。CGEMS計画は、5p12領域において、ゲノム全体での明らかなシグナルを見出さなかった。しかし、発明者らは、1つのSNP、すなわちrs4415084は、アイスランド(アイスランド1コホート)から得たデータおよびCGEMSデータセットを合わせて分析した場合、P値が1.38E−07であり、ボンフェローニ補正後、ゲノム全体で有意であることに注目した。このSNPは、CGEMSデータセットにおいては目立たないP値(2.21E−03)を有し、合わせた値のゲノム全体の有意性は、主に、アイスランド1(P値が9.02E−06)が有している。従って、CGEMSデータは、それ自身の上ではどこにも有意性がないが、染色体5p12に関連する発明者の当初の知見についての確証を与える。
(多数のHapMap(非イルミナ)SNPマーカーは、5p12領域における関連を示したイルミナSNPとのそれらの相関を通じて、BCリスク関連を示し得る)
発明者らは、この部位に対立遺伝子の不均一性があるかも知れない、すなわち、2つ以上の根底にあるリスクを有する変異体が、試験されたイルミナSNPセットと異なる程度で相関する5p12領域に存在し、異なる集団において異なる頻度で存在するかも知れないと考えた。これは、最も有意なマーカーのクラスターの遠位に、有意であると思われるシグナルがあるという知見に基づく(図1参照)。さらに、発明者らは、いくつかの症例では、関連シグナルは、アイスランド1の試料では非常に強いが、CGEMSデータにおいては強くないことに注目した。例えば、上記rs4415084 SNPは、アイスランド1において非常に強いシグナルを与えるが、CGEMSデータではそうではなかった。同様に、アイスランドにおける再現がうまく試験されたSNP(rs7703618)は、6.93E−06のP値を与え、CGEMSデータセットでは、2.37E−02でしかなかった。5p12領域において対立遺伝子の不均一性があるかも知れないと仮定して、発明者らは、発明者らがアイスランド1のデータセットにおいて観察したシグナルとの相関を通じて、5p12領域における全ての病原性変異を検出するために使用され得るHapMap SNPのセットを定める。このようなHapMap SNPのセットを同定するため、発明者らは、最初に、アイスランド1データセットにおいて、10E−3以下のP値を与えるSNPのクラスを同定した。次いで、発明者らは、このセットを同値類、2つのSNPの間のr2値が>0.8である、2つのSNPとして定められた特定の同値類のメンバーである、同類値に分けた。これは、発明者らがA〜Fと命名した、6つの同値類のセットをもたらした。各同値類について、発明者らは、当該クラスにおいて最も有意なシグナルを与えるSNP(発明者らによって「鍵となる」SNPと表わされる)から開始し、次いで、HapMapデータの参照によって、発明者らは、鍵となるSNPと相関し(r2値が0.2以上)、それら自身はイルミナ Hap300チップ上に表わされていない、全てのHapMap SNPを同定した。従って、アイスランド1のデータを使用して、発明者らは、いくつかの異なる同値類におけるシグナルを観察し、事実は、本来、対立遺伝子の不均一性についてのエビデンスを与えることを観察した。これらのHapMap SNPはまた、発明者らが同定した1つ以上の同値類におけるSNPとのそれらの相関を通じて、発明者らが当初観察した同一の乳癌リスク関連を検出するために使用され得る。鍵となるSNPの一覧表およびHapMap SNPとのそれらの相関は、表4に示される。
(FGF10およびMRPS30は、5p12領域において最も可能性のある候補遺伝子である)
図1は、組み換えホットスポット、染色体バンド、既知の遺伝子、および組み換え率のマップ上に重ねられた5p12領域において得られた関連シグナルのプロットを示す。組み換えホットスポットおよび組み換え率は、McVeanらによって記載されたように測定された(McVeanら、(2004)、Science、304、581〜4)。当該領域におけるHapMap SNP間のr2値の表示もまた示されている。当該領域において注目すべき3つの既知の遺伝子(FGF10、MRPS30、およびHCN1)が、1つの特徴が乏しい遺伝子 LOC441070とともに見出され得る。これらのうち2つ(FGF10およびMRPS30)は、乳癌の素因の関与についての有力な候補である。
HowardおよびAshworthによるレビューのように(HowardおよびAshworth、(2006)、PLoS Genet、2、el12)、FGF10は、乳房の正常な胚発生に必要とされる。FGF10は、MMTV挿入変異原性による乳癌のマウスのモデルにおける癌遺伝子として関係付けられてきており、FGF10は、ヒト乳癌の約10%で過剰発現している(Theodorouら、(2004)、Oncogene、23、6047〜55)。図1において見出され得るように、FGF10遺伝子は、組み換えホットスポットによる関連シグナルの主要なクラスターから分離された。しかし、FGF10の制御を管理する鍵となる要素は、強い関連シグナルが生じる領域に存在するかも知れない。あるいは、当該関連シグナルは、FGF10遺伝子それ自体の中の病原性変異と連鎖不平衡にあるかも知れない。
MRPS30は、ミトコンドリアの28Sリボソームのサブユニットをコードする。これは、プログラム細胞死タンパク質9(PDCD9)としても知られる。これは、ニワトリアポトーシス促進性タンパク質p52の哺乳類における対応物である。これは、アポトーシスを誘導し、哺乳類細胞におけるストレス応答性JNK1経路を活性化することが示された。当該タンパク質は、Bcl−2経路を通じて、少なくとも部分的にアポトーシスにおいて機能すると思われる(Sunら、(1998)、Gene、208、157−66;Carimら、(1999)、Cytogenet Cell Genet、87、85〜8;Cavdar Kocら、(2001)、FEBS Lett、492、166〜70)。これは、以前は乳癌において関係付けられて来なかったが、上記経路におけるその関与は、MRPS30における遺伝的変異体は、乳癌リスクの改変に関連しているかも知れないことを示唆している。
(方法)
(患者および対照の選択)
本研究の承認は、アイスランド国立生命倫理委員会(National Bioethics Committee of Iceland)およびアイスランド人データ保護局(Icelandic Data Protection Authority)によって与えられた。乳癌診断の記録は、アイスランド人の癌の登録簿(Icelandic Cancer Registry、ICR)から入手した。当該ICRは、アイスランドで1955年1月1日から診察された、浸潤性乳腺腫瘍および乳管癌または上皮内小葉癌の全ての症例を含む。2005年12月末までにICRに記入された診断を受けた、アイスランドに住んでいる全ての人々は、本研究への参加適格がある。当該ICRは、この期間に診察された4603個体の記録を含む。全ての生存する患者(約2840)からなる罹患コホートは、本研究に動員される適格がある。発明者らは、2210の患者からインフォームドコンセント、血液試料、および診断情報を得ており、参加率は約78%であった。遺伝子型の同定は、rs7703618について2190患者全体で成功した。この患者群の動員のさらなる詳細は、以前に報告されている(Staceyら、(2006)、PLoS Med、3、e217)。
12,904アイスランド人の対照は、アイスランド人系統学のデータベースからランダムに選択された846個体、およびディコーデ(deCODE)での、他の進行中のゲノム全体での関連研究からの12,058個体からなる。ICRにおいて乳癌の診断を受けた個体は、除外した。男性および女性の両方が含まれる。
(イルミナ遺伝子型の同定)
DNA試料について、国際HapMap計画の第I相に由来する317,503SNPを含むイルミナ インフィニウム(Infinium) ヒトHap300 SNP ビーズマイクロアレイ(イルミナ社(Illumina)、米国、カリフォルニア州、サンディエゴ)についての製造者の説明書に従い、遺伝子型を同定した。このチップは、r2≧0.8の共通のSNPについてのユタ州のCEPH(CEU)HapMap試料の約75%のゲノムの網羅を与える(BarrettおよびCardon、(2006)、Nat Genet、38、659〜62)。チップ上のSNPの全体数のうち、5979は、これらが単形性(すなわち、合わせた患者および対照のセットにおける少ない対立遺伝子頻度が0.001未満であった)であったためか、低い(<95%)収率を有していたためか、または対照においてハーディ・ワインベルグ平衡からの非常に有意な歪みを示したためか(P<1×10−10)、のいずれかの理由で不適であるとみなした。これらの問題のSNPの全てを分析から除去した。従って、311,524のSNPが、関連分析において使用された。SNPの98%を下回る全体のコールレート(call rate)を有するいずれのチップもまた、ゲノム全体での関連分析から除去した。
(ケンタウルスSNP遺伝子型の同定)
ケンタウルスアッセイ(Kutyavinら、(2006)、Nucleic Acids Res、34、e128)を、rs7703618について設計し、HapMap CEU試料の遺伝子型を同定し、遺伝子型を公表されたデータと比較することで検証した。当該分析は、HapMapデータについて<1.5%のミスマッチを与えた。表5は、本願明細書において議論された鍵となるSNPの配列構成を示す。表6は、本研究における遺伝子型の同定のために開発されたマーカーrs7703618のためのケンタウルスアッセイについての記述を示す。
(統計学的方法)
発明者らは、複合モデルを仮定して、すなわちヒトが保有する2つの対立遺伝子の相対リスクが増加すると仮定したSNP対立遺伝子のオッズ比(OR)を算出した。保有者頻度よりも対立遺伝子の頻度が、当該マーカーに表われた。関連したP値は、NEMOソフトウェアパッケージにおいて実行されるように、標準的な尤度比のカイ2乗統計量で算出した(Gretarsdottirら、(2003)、Nat Genet、35、131〜8)。信頼区間は、ORの評価が対数正規分布を有すると仮定して算出した。
いくらかのアイスランド人の患者および対照は、群内および群間の両方で関連しており、カイ2乗検定統計量が、1超の平均値および0.6752超の中央値を有する原因となっている。発明者らは、関連性および潜在的な集団の層別化を説明する、ゲノム全体でのSNPセットについての観察されたカイ2乗統計量の平均値を算出することによって、ゲノム制御方法を使用してアイスランド1についての膨張因子を評価した(DevlinおよびRoeder、(1999)、Biometrics、55、997〜1004)。アイスランド2については、マーカーのゲノム全体のセットについて分類されておらず、当該膨張因子は、アイスランド人の系統学を通じて遺伝子型をシミュレートすることで評価した(Grantら、(2006)、Nat Genet、38、320〜3)。評価された膨張因子は、アイスランド1では1.105、アイスランド2では1.11であった。アイスランド1およびアイスランド2の試料セットの共同解析において評価された膨張因子は1.08であり、シミュレーションによって得た。
全てのP値は、両側として報告した。
(実施例2:染色体5p12上の関連シグナルの改良、臨床上の変量との相関、および染色体10q26上のFGFR2部位の検討)
発明者らが染色体5p12上で同定したシグナルは、低い組み換えを呈している染色体5p12−llに広くわたって位置している。この領域から、発明者らは、イルミナ Hap300チップセットから10のSNPを選択し、ケンタウルス SNPアッセイ(Kutyavinら、(2006)、Nucleic Acids Res、34、e128)を作製し、これらをアイスランドから得たさらなる試料、ならびにスウェーデン、オランダ、スペインおよび米国から得た再現試料において分類した。全体では、ヨーロッパ人の系統の5028の症例および32090の対照を検討した。当該領域において最も強く関連したイルミナ SNPはrs4415084であり、そのT対立遺伝子は、1.16の合わせたオッズ比(OR)、および6.4×10−10のP値を与え、それは、ゲノム全体での有意性についてのボンフェローニ判断基準に適合する(表6)。再現試料単独では、rs4415084は、1.14のOR(P=7.5×10−5)を与えた。当該シグナルを改良するため、発明者らは、イルミナチップ上にないが、Hap300 SNPとLDにあり、実質的なシグナルを与える、さらに11のSNPを分類した。これらのSNPから得たデータを、表6および7に表わした。最も強い全体のシグナル(OR 1.19、P=2.9×10−11)は、rs10941679のG対立遺伝子(rs4415084と相関する非イルミナ SNP(アイスランド人の集団においてD’=0.99、r2=0.51、表8))から生じた。
対立遺伝子G−rs10941679は、T−rs4415084よりもあまり一般的でなく、ほぼ完全にT−rs4415084のバックグラウンド上に含まれる。しかし、多変量解析において、T−rs4415084は、G−rs10941679についての補正後も名目上の有意性を保持し(P=0.042)、逆もまた同じであった(P=0.0017、表9)。従って、高度に相関しているにも関わらず、どちらのSNPも5p12で観察されたシグナルについて完全に説明しない。発明者らは、T−rs4415084およびG−rs10941679の両方が乳癌のリスクを与えると結論付けた。多変量解析は、SNP rs7703618からのシグナルは、完全に、T−rs4415084またはG−rs10941679のいずれかによって説明され得ることを明らかにした(表9)。
発明者らは、入手できる場合は患者の診察記録を検討し、5p12での2つのリスク変異体、および染色体10上のFGFR2部位でのマーカーrs1219648についてのアイスランド人の試料セットおよび再現試料セットから得た合わせたデータを分析した。全ての3つの変異体は、エストロゲン受容体(ER)陰性の腫瘍よりも、ER陽性の乳癌についての有意に大きなリスクを与えた(表6および10)。同様の優先的なリスクを、5p12変異体についてのプロゲステロン受容体陽性の腫瘍に見出した(表10)。発明者らは、以前に、2q35および16q12上の感受性変異体は、特に、ER陽性の腫瘍と関連することを報告した(Staceyら、(2007)、Nat Genet)。本願における知見は、ER陽性の腫瘍およびER陰性の腫瘍が、それらのリスクについて異なる遺伝的要素を有するという考えに対してさらなる支持を付加する。
5p12 SNPはまた、より低い組織学的グレードとの関連性を示し、これは多変量解析におけるER状態との関連によって説明される。FGFR2 SNPは、リンパ節陽性腫瘍において、リンパ節陰性腫瘍よりも高頻度である。腫瘍のステージまたは病理組織診断との有意な関連性はなかった(表10)。診断時の年齢との有意な関連を示した変異体はなかった。以前の報告(Huijtsら、(2007)、Breast Cancer Res、9、R78;Eastonら、(2007)、Nature 447:1087〜93)と合致し、FGFR2 SNPは、乳癌の家族歴と関連していた。統計学的に有意ではないが、同様の傾向が5p12 SNPにおいて観察された(表11)。
(方法)
(患者および対照の選択)
研究の被験者からの血液試料および医療情報の収集は、インフォームドコンセントおよびヘルシンキ宣言に従った倫理審査委員会の承認を得て行った。
アイスランド:乳癌診断の記録は、アイスランド人の癌登録簿(ICR)から入手した。当該ICRは、1955年1月1日から、アイスランドで診断された、浸潤性乳腺腫瘍および乳管癌または上皮内小葉癌の全ての症例を含む。2006年12月末までにICRに記入された診断を受けたアイスランドに住んでいる全ての有病の症例は、本研究への参加適格がある。当該ICRは、この期間に診断された4785の個体の記録を含んでいた。同意、試料および良好な遺伝子型は、約2277の患者から入手した。これらのうち、遺伝子型は、1791の患者についてのイルミナ Hap300チップ、および486の患者についてのケンタウルスアッセイに由来した。26,199のアイスランド人の対照は、ディコーデでの進行中のイルミナに基づくゲノム全体での関連研究から選択された個体からなっていた。ICRにおける乳癌の診断を受けた個体は除外した。男性および女性の両方が含まれていた。アイスランド人の対照(および下記の外国の再現対照群)において、表6に記載されたSNPの頻度について、性別間で有意差はなかった。従って、発明者らは、これらの対照群は、検討下でのSNPの集団頻度の適切な表示を与えると考えた。
スペイン:スペイン人の研究患者は、2006年3月から2007年8月の間に、サラゴサ病院の癌科から動員された。遺伝子型の同定は、十分に、約642の患者において行った。1540のうまく遺伝子型を同定された対照は、サラゴサの大学病院に、癌以外の疾病で通院していた。対照は、血液試料を抜く前に、従前の癌を除外するために質問を受けた。全ての患者および対照は、ヨーロッパ民族である。
スウェーデン:スウェーデン人の試料セットは、家族性患者の系列および継続患者の系列からなっていた。家族性乳癌の動員群は、乳癌の家族歴の検討についてカロリンスカ大学病院(ストックホルム)の癌遺伝子のカウンセリングクリニックを紹介された347の乳癌患者からなっていた。各患者は、別個の家庭の出身である。BRCA変異のスクリーニングについての現在の判断基準に適合する全ての症例は、陰性の結果が出た。継続性乳癌の動員群は、フディンゲ(Huddinge)病院およびゼーダー(Soeder)病院の癌科(南ストックホルムの集団を網羅)で、1998年10月から2000年5月まで、原発性湿潤性乳癌について外科的に治療された、482の継続的に動員された患者からなっていた。家族歴は、動員のための患者の選択において考慮しなかった。対照は、両方の性別の1302の血液提供者および448の癌のない個体である。全ての対照は、カロリンスカ大学病院(ストックホルム)で収集した。いずれの試験されたSNPについて、家族性の系列と継続性の系列との間に有意な不均一性のエビデンスはなかった。
オランダ:2005〜2006年の期間に乳癌と診断された女性の患者は、総合癌センター(Comprehensive Cancer Centre、オランダ、東ナイメーヘン)が保有する局所性癌の登録簿から選択された。この癌センターは、集団に基づく癌登録簿を保有し、オランダ東部(130万の住民の領域)を網羅する。70歳よりも前に乳癌と診断された全ての患者は、本研究に参加するよう、招かれた。東総合癌センターは、癌登録簿における全ての患者についての臨床上のデータおよび病理学上のデータを収集した。これらの標準的な癌登録簿のデータには、患者が治療された病院の医療ファイルからの抽出による、より詳細なデータが追加されている。対照は、ラートボウト(Radboud)大学ナイメーヘン医療センターによる、2002〜2003年の調査において収集された。この調査(ナイメーヘン生物医学研究)は、ナイメーヘンの集団における年齢を層別化したランダム試料に基づく。この群から、患者集団に対する頻度によって年齢をマッチさせた、2034の対照個体を選択し、遺伝子型を同定した。
米国多民族コホート:多民族コホート研究(Multiethnic Cohort study、MEC)は、ハワイおよびロサンジェルスの215,000超の男性および女性(と、さらにカリフォルニアの各地からのアフリカ系アメリカ人)からなる。当該コホートは、主に、アフリカ系アメリカ人、ハワイ原住民、日系アメリカ人、ラテン系アメリカ人およびヨーロッパ系アメリカ人からなり、彼らは、食生活、人口統計学的要因、個人的な行動、前病歴、一般的な癌の家族歴、ならびに女性については、出産歴および外因性ホルモンの使用についての詳細な情報について質問している26ページの自己記入質問表を完成させることによって、1993〜1996年の間に本研究に加入した。当該参加者は、加入時に、45〜75歳の間だった。MECにおける偶発的な癌は、集団に基づく癌調査、疫学および最終的な結果(SEER)登録簿(ハワイおよびロサンジェルス郡を網羅)、ならびにカリフォルニアの全てを網羅するカリフォルニア州の癌登録簿とのコホート連鎖によって同定された。1994年に開始し、血液試料は、当該コホートの遺伝子解析のための対照プールとするために、偶発的な乳癌の症例およびMEC参加者のランダム試料から収集した。乳癌コホート内症例対照研究における適格のある症例は、2002年12月31日までに、MECに加入後に診断された偶発的な浸潤性癌を有する女性からなっていた。対照は、当該コホートに加入前に乳癌がなく、2002年12月31日までに診断のなかった参加者であった。対照は、人種/民族性および年齢(5年間隔)に基づき、症例に頻度をマッチさせた。
ナイジェリア:発明者らは、ナイジェリアのイバダンの、689の偶発的な乳癌症例および469の対照から遺伝子型を得た。症例は、診察時に継続的に動員され、後に、ユニヴァーシティカレッジ病院の手術および放射線療法科(ナイジェリア、イバダン)で、組織学的に確認された。この病院は、300万人の管轄区域を有し、当該領域の他の病院の腫瘍学照会センターである。集団に基づく対照は、当該病院に隣接する地域から、ランダムに動員された。地域での診察過程の後、対照被験者は、本研究の目的のために設けられた診療所に通院するように招かれた。対照は、動員時に癌がなく、18歳超であった。
(遺伝子型の同定)
約1791のアイスランド人患者および26199の対照は、イルミナ Hap300SNPアレイ上で、以前に(Staceyら、(2007)、Nat Genet 39:865〜9)で記載されたように遺伝子型を同定された。全ての他の遺伝子型の同定は、表7に示されたSNPのために作製された、ナノゲン(Nanongen)ケンタウルスアッセイ(Kutyavinら、(2006)、Nucleic Acids Res、34、el28)を使用して行われた。プライマー配列は、要求に応じて入手できる。ケンタウルス SNPアッセイは、HapMap CEU試料の遺伝子型の同定、および公表されたデータとの遺伝子型の比較によって検証された。アッセイは、HapMap データと、≧1.5%のミスマッチを示した場合、拒絶された。アイスランド人の症例試料の約10%がイルミナおよびナノゲンプラットフォームの両方で遺伝子型を同定され、観察されたミスマッチ率は、0.5%よりも低かった。全ての遺伝子型の同定は、ディコーデジェネティクス(deCODE Genetics)の設備で行われた。全ての物理的な座標は、NCBI ビルド35に従って与えられた。
(臨床上のパラメータ)
エストロゲン受容体およびプロゲステロン受容体の状態は、診察記録で報告された免疫組織化学的アッセイまたは免疫(immunometric)アッセイの結果に由来した。≧10fmol/mgの受容体レベルまたは≧10%の陽性の核についての免疫組織化学的な知見は、陽性であるものとみなした。ステージは、対癌米国合同委員会(第6版)に従って決定した。組織学的サブタイプは、SNOMED−M(または、等価のICDO)コードから、下記のように決定された:「浸潤性乳管癌」:8500/3、8521/3;「DCIS」(非浸潤性乳管癌および関連する上皮内癌):8500/2、8050/2、8201/2、8501/2、8503/2、8507/2、8522/2;「浸潤性小葉癌」:8520/3;「LCIS」(上皮内小葉癌):8520/2;「管状癌または粘液性癌」:8211/3、8480/3、8481/3;「髄様癌」:8510/3、8512/3;「混合型浸潤性癌」:8522/3、8523/3、8524/3、8541/3、8543/3;「他の浸潤性癌」:8050/3、8141/3、8200/3、8260/3、8323/3、8401/3、8490/3、8501/3、8503/3、8504/3、8530/3、8540/3。下記の非特異的コードを有する腫瘍は、病理組織学的タイプの分析から除外した:8000/3、8010/2、8010/3、8010/6、8020/3、8140/2、8140/3、8230/3。組織学的グレードは、ノッティンガム(スカーフ・ブルーム・リチャードソン(Scarff−Bloom−Richardson)のエルストン・エリス(Elston−Ellis)改変)システムに従って特定された。節の状態は、ステージI〜IIIBについて分析され、腋窩リンパ節の精査および/またはセンチネルリンパ節の組織診によって得られた病理学的病期分類に基づく。スウェーデン家族性(Familal)試料セットは、臨床上のパラメータの分析に使用されなかった。
(統計学的分析)
発明者らは、複合モデルを仮定して、すなわち、ヒトが保有する2つの対立遺伝子の相対リスクが増加すると仮定した各SNP対立遺伝子についてのORを算出した。対立遺伝子の頻度およびORは、当該マーカーについて表わした。関連するP値は、NEMOソフトウェアパッケージで実行されるように、標準的な尤度比χ2統計量で算出した(Gretarsdottir S.ら、Nat.Genet.35:131〜38(2003))。信頼区間は、ORの評価が対数正規分布を有すると仮定して算出した。強いLDにあるSNPについては、1つのSNPの遺伝子型が個体について失われていたときはいつでも、相関したSNPの遺伝子型は、前述の尤度法を通じて遺伝子型を推定するために使用された(Gretarsdottir S.ら、Nat.Genet.35:131〜38(2003))。これは、異なるSNPについて示された結果が、同じ数の個体に基づくことを保証し、ORとP値との有意義な比較を可能にした。複数の症例−対照の再現群の共同解析は、当該群が対立遺伝子または遺伝子型の異なる集団頻度を有することを可能にさせるが、共通の相対リスクを有すると仮定された、マンテル・ヘンツェルモデルを使用して行われた。不均一性の検定は、対立遺伝子の頻度が帰無仮説下で、全ての群で同一であるが、各群は、別の仮説下で異なる対立遺伝子の頻度を有すると仮定することによって行われた。症例の複数の群の共同解析は、群の指標を共変動として使用して、多分岐のロジスティック回帰分析に相当する拡張したマンテル・ヘンツェルモデルを使用して行われた。いずれの試験されたSNPについての再現試料セット間の不均一性のエビデンスはなかった。診断時の年齢および組織学的グレードとのリスク変異体の関連は、パラメータ値と各個体が保有するリスク対立遺伝子のコピー数との間の線形回帰によって試験された。
家族歴の分析について、発明者らは、発明者らの前述の方法(Amundadottir L.T.ら、PLoS Med.1:e65(2004))を適用することによって、遺伝子型特異的な家族性の相対リスク(gfRR
gt)に適応するために、各遺伝子型について第一度近親者についての家族性の相対リスクを算出した。各SNPの遺伝子型について、発明者らは、gfRR
gtを下記の数式のように定めた。
式中、rは、遺伝子型gtを有する乳癌患者の第1度近親者の数(遺伝子型gtを有する2人以上の患者に関連する個体を複数回数えた)であり、aは、自身が乳癌に罹患している遺伝子型gtを有する乳癌患者の第1度近親者の数である。分母においては、nは、集団の大きさであり、xは、集団における疾病に罹患している人々の数である(ICRの記録による)。1つの遺伝子型の観察されたgfRR
gtを、別のものと比較するため、発明者らは、gfRR
gt1/gfRR
gt2比を算出した。これらの後者の比の有意性は、シミュレーションによって定めた。各gfRR
gtについての対照群は、問題になっているSNPについて遺伝子型を同定された乳癌患者のセットから、ランダムに引き出した。当該対照群は、対応する観察された各gfRR
gt群と同一の大きさであり、アイスランド人系統学のデータベースに記載された親の数(0、1、または2)にマッチさせた。対照群のgfRR
gt1/gfRR
gt2比の1万の反復が算出され、P値は、対照群の比が観測されたgfRR
gt1/gfRR
gt2と一致、または上回った頻度を数えることによって、定めた。
発明者は、ハーディ・ワインベルグ平衡を仮定した集団における遺伝子型の頻度を評価することによって、遺伝子型特異的なORを算出した。多重度からの明らかなずれは観察されなかった。位置間の潜在的な相互作用は、対立遺伝子数の相関試験を使用し、保有者および非保有者の症例−対照の関連によって試験した。明らかな相互作用は観察されなかった。
アイスランド人の患者および対照のいくらかは、群内および群間の両方で互いに関連しており、Χ2統計量が>1の平均を有した。発明者らは、以前に記載されたように(Grant S.F.ら、Nat Genet 38:320〜3(2006))、アイスランド人系統学を通じて、遺伝子型をシミュレーションすることによって膨張因子を評価し、Χ2統計量を、アイスランド人のORについて、しかるべく補正した。評価された膨張因子は、アイスランド人の完全なセット(症例および対照)について1.08であり、臨床上の表現型の分析に使用された全ての他のサブセットについてはより小さく、しかし≧1であった。