WO2003020968A2 - Method for analyzing nucleic acid sequences and gene expression - Google Patents

Method for analyzing nucleic acid sequences and gene expression Download PDF

Info

Publication number
WO2003020968A2
WO2003020968A2 PCT/EP2002/009614 EP0209614W WO03020968A2 WO 2003020968 A2 WO2003020968 A2 WO 2003020968A2 EP 0209614 W EP0209614 W EP 0209614W WO 03020968 A2 WO03020968 A2 WO 03020968A2
Authority
WO
WIPO (PCT)
Prior art keywords
nts
primer
sequence
nskfs
primers
Prior art date
Application number
PCT/EP2002/009614
Other languages
German (de)
French (fr)
Other versions
WO2003020968A3 (en
Inventor
Dimitri Tcherkassov
Original Assignee
Genovoxx Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genovoxx Gmbh filed Critical Genovoxx Gmbh
Priority to AU2002337030A priority Critical patent/AU2002337030A1/en
Publication of WO2003020968A2 publication Critical patent/WO2003020968A2/en
Publication of WO2003020968A3 publication Critical patent/WO2003020968A3/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Definitions

  • the invention relates to a method for analyzing nucleic acid chains and gene expression.
  • the basis of the method is the detection of fluorescence signals of individual nucleotide molecules labeled with dyes, which are incorporated into a growing nucleic acid chain by a polymerase.
  • the reaction takes place on a flat surface. Many individual nucleic acid molecules are bound to this surface. All of these nucleic acid molecules are exposed to the same conditions, so that a build-up reaction can take place simultaneously on all nucleic acid molecules.
  • the process essentially comprises the following steps:
  • NSKFs nucleic acid chain fragments
  • the cycle is repeated several times.
  • DNA - deoxyribonucleic acid of different origins and different lengths (genomic DNA, cDNA, ssDNA, dsDNA)
  • RNA - ribonucleic acid (mostly mRNA)
  • Polymerases - enzymes that can incorporate complementary nucleotides into a growing DNA or RNA strand e.g. DNA polymerases, reverse transcriptases, RNA polymerases
  • dNTP - 2 deoxy nucleoside triphosphates, substrates for DNA polymerases and reverse transcriptases
  • NT - natural nucleotide usually dNTP, unless expressly stated otherwise.
  • NT is also used when specifying the length of a nucleic acid sequence, e.g. NT 1,000.
  • NT stands for nucleoside monophosphates.
  • NT * - modified nucleotide, usually dNTP, unless expressly stated otherwise.
  • NTs * means: modified nucleotides
  • NSK - nucleic acid chain DNA or RNA in their original length
  • NSKFs Nucleic acid chain fragments.
  • the sum of the NSKFs is equivalent to the overall sequence.
  • the NSKFs can, for example, be fragments of the entire DNA or RNA sequence that arise after a fragmentation step.
  • Total sequence the sequence or sequences used in the sequencing reaction, mostly converted into NSKFs. It can originally consist of one or more NSKs. The total sequence can be parts or equivalents
  • Represent 0 of another sequence or of sequence populations e.g. mRNA, cDNA, plasmid DNA with insert, BAC, YAC
  • Represent 0 of another sequence or of sequence populations e.g. mRNA, cDNA, plasmid DNA with insert, BAC, YAC
  • Primer binding site (PBS) - part of the sequence in the NSK or 5 NSKF to which the primer binds.
  • Reference sequence - a sequence already known, to which the deviations in the sequence to be examined or in the sequences to be examined (overall sequence) are determined.
  • D Sequences accessible in databases can be used as reference sequences, e.g. from the NCBI database.
  • Plane surface - surface which preferably has the following features: 1) It allows several individual molecules, preferably more than 100, more preferably more than 1000, to be detected simultaneously with the given objective-surface distance at one objective position. 2) The
  • the immobilized individual molecules are in the same focal plane, which can be set reproducibly.
  • Wide-field optical detection system - detection system that can simultaneously detect fluorescence signals from individual molecules distributed over a surface, the surface being approximately 100 ⁇ m 2 and larger.
  • An example of wide-field detection optics is provided by the Axiovert 200 or fluorescence microscope Axioplan 2e (Zeiss) with a planofluar objective lOOx NA 1.4 oil immersion (Zeiss), or a planapochromatic objective lOOx NA 1.4 oil immersion (Zeiss);
  • the fluorescence can be excited using a lamp, for example a mercury vapor lamp, or a laser or diode. Both epifluorescence mode and total internal reflection fluorescence microscopy (TIRF microscopy) mode or laser scanning microscopy mode can be used.
  • This wide field detection optics is used in this application
  • termination is the reversible stop in the installation of the modified, uncleaved NTs * .
  • the termination comes after the installation of a modified NT * .
  • the substituent can be split off under mild conditions, so that the 3" - OH function again for the incorporation of an NT * is available.
  • a fluorescent dye is coupled to these substituents.
  • Gene products - The gene products are the primary gene products of the genes. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to mRNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
  • Single nucleotide poly orphisms single nucleotide polymorphisms, SNPs
  • SNPs single nucleotide polymorphisms
  • Another sequencing method is based on the hybridization of nucleic acid chains with short oligonucleotides. Mathematical methods are used to calculate how many oligonucleotides of a certain length are required to determine a complete sequence (ZT Strezoska et al. PNAS 1991 v.88 p.10089, RSDrmanac et al. Science 1993 v.260 p.1649 ). This method also has problems: only one sequence can be determined in one approach, secondary structures disrupt it Hybridization and repeats prevent correct analysis.
  • a large number of identical single-stranded DNA pieces are fixed at a defined location on a surface and the signal from all of these many identical DNA pieces is analyzed.
  • a solution with polymerase and nucleotides is added to this fixed DNA so that a complementary strand can be synthesized.
  • the polymerase should work step by step: only one nucleotide is incorporated in each step. This is detected, whereupon the polymerase incorporates the next nucleotide in a next cycle.
  • the analysis of gene expression is a complex task: the number of genes active in a cell type can be several thousand. However, the analysis should consider all genes contained in the genome of the species in question (approximately 32,000 in humans). In addition, the genes active in the respective cell type are first of all mostly not yet completely known and secondly they are expressed to different extents.
  • the major disadvantages of the hybridization method include: The production of the oligonucleotides bound to the surface is expensive. The analysis is limited to genes whose sequences are already known. Multiple mismatch controls increase the number of oligonucleotides that need to be immobilized.
  • the object of the present invention is therefore to provide a method for the sequence analysis of nucleic acid chains and the analysis of gene expression which does not have the disadvantages of the above-mentioned methods and, above all, enables a cheaper, faster and more efficient analysis of nucleic acid sequences.
  • the method should be able to determine many sequences in parallel. It can then be used, for example, for the analysis of very long nucleic acid chains (several Mb) or for variant analysis on many short chains (mutation analysis, SNP analysis) in one approach.
  • the present invention relates to a method for parallel sequence analysis of nucleic acid sequences (nucleic acid chains, NSKs), in which
  • NSKFs Single-stranded NSKs with a length of about 50 to 1000 nucleotides are generated, which represent overlapping partial sequences of the total sequences
  • the NSKFs are bound on a reaction surface in a random arrangement using one or more different primers in the form of NSKF-primer complexes cyclically build the complementary strand of the NSKFs using one or more polymerases by:
  • a solution is added to the NSKF primer complexes bound to the surface, which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * Fluorescent dyes located on the NTs * are selected such that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * being structurally modified such that the polymerase does not form after incorporating such an NT * into a growing complementary strand is able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye
  • stage b) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
  • stage b) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
  • the individual NTs * built into complementary strands are detected by measuring the signal which is characteristic of the respective fluorescent dye, the relative position at the same time of the individual fluorescence signals on the reaction surface is determined
  • step f) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
  • stages a) to f) are repeated several times, if necessary,
  • the overall sequence of the NSKs can be determined, for example, from the partial sequences determined.
  • a parallel sequence analysis is understood to mean the simultaneous sequence analysis of many NSKFs (for example 1,000,000 to 10,000,000), these NSKFs being derived from a uniform NSK population or from several different NSK populations.
  • the resulting population of overlapping partial sequences can be combined, for example, in de novo sequencing with commercially available programs to form the overall sequence of the NSK (Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257).
  • mutations or single nucleotide polymorphisms can be identified by comparing the obtained overlapping partial sequences with the reference sequence.
  • the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
  • the method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently marked NTs * and two unmarked NTs in the cycles and one Total sequences determined by comparison with the reference sequence.
  • the present invention also relates to a method for highly parallel analysis of gene expression, in which
  • the gene products are bound on a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes, one
  • a solution is added to the gene product-primer complexes bound to the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * each * located at the NTs fluorescent dyes are selected so located that can differ from each other, the NTs used * by measuring different fluorescent signals, the NTs * are structurally modified 'so that the polymerase after incorporation of such NT * not in a growing complementary strand is able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye, man
  • stage b) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
  • stage b) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
  • the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
  • step f) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
  • stages a) to f) are repeated several times, if necessary,
  • the gene products are the primary gene products of the genes whose expression is to be analyzed. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to RNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
  • the gene products or target sequences can either be isolated as mRNAs directly from a biological sample (e.g. cell extract, tissue extract or extract from whole organisms) or obtained as cDNAs by reverse transcription of the mRNAs.
  • a highly parallel analysis is understood to mean the simultaneous sequence analysis of many gene product molecules (for example 1,000,000 to 10,000,000), these gene product molecules being a complex one represent a heterogeneous population that corresponds, for example, to a complete expression profile or an expression spectrum of a tissue.
  • the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
  • the method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and comparing the identity of the gene products with the reference sequences determined.
  • the invention further relates to a kit for carrying out the method which contains a reaction surface, reaction solutions required for carrying out the method, one or more polymerases, and nucleotides (NTs), one to four of which are labeled with fluorescent dyes, the NTs * on the 3 'position are structurally modified so that after installing such an NT * in a growing complementary strand, the polymerase is not able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye.
  • NTs nucleotides
  • the kit also contains for the production of Single strands of double strands required reagents, single stranded nucleic acid molecules, which are introduced as PBS in the NSKFs, oligonucleotide primers, for cleaving off the fluorescent dyes and the reagents and / or washing solutions leading to termination.
  • the method according to the invention is used to determine the nucleic acid sequences and can be used in various areas of genetics. This includes in particular the determination of unknown, long sequences, analysis of sequence polymorphisms and point mutations as well as the parallel analysis of a large number of gene sequences and the analysis of gene expression.
  • the preparation of the material to be analyzed depends on the task at hand and the aim is to create a population of relatively small, single-stranded nucleic acid chain fragments (NSKFs) from a long nucleic acid chain. to form, to provide these fragments with a primer suitable for starting the sequencing reaction (NSKF-primer complexes) and to fix them on a flat surface.
  • NSKFs single-stranded nucleic acid chain fragments
  • NSKFs are fixed on a flat surface in such a way that an enzymatic reaction can take place on these molecules.
  • different types of immobilization are possible, which depend on the objective, the type of NSK and the polymerase used for the reaction.
  • the NSKFs are randomly distributed on the surface during immobilization or binding, that is, it is not necessary to ensure that the individual chains are positioned exactly.
  • NSKF primer complexes can be bound to the surface via the NSKFs or primers.
  • the NSKF primer complexes must be fixed to the surface in such a density ensure that the later-detected signals are clearly assigned by the installed NT * s to individual NSKFs.
  • the sequencing reaction is started with all NSKF primer complex molecules immobilized on the surface.
  • the sequencing is based on the synthesis of the complementary strand to each individual bound NSKF.
  • Labeled NTs * are installed in the newly synthesized strand.
  • the polymerase incorporates only one labeled NT * into the growing chain in one cycle.
  • a cycle comprises the following steps:
  • NTs * labeled nucleotides
  • reaction conditions of step (b) in a cycle are selected so that the polymerases can incorporate a labeled NT * on more than 50% of the NSKFs (NSKF primer complexes capable of expansion) which are involved in the sequencing reaction, preferably on more than 90%.
  • NSKFs NSKF primer complexes capable of expansion
  • the number of cycles to be carried out depends on the task at hand, and is not theoretically limited and is preferably between 20 and 5000.
  • the original NSK sequence can be reconstructed from the overlapping NSKF sequences ("Automated DNA sequencing and analysis” p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257).
  • the entire population of NSKF sequences is searched for matches / overlaps in the sequences of NSKFs. Through these matches / overlaps, the NSKF can be aligned, e.g .:
  • the errors in the method can be recorded and corrected using various means. All steps of the process can be largely automated.
  • the gene products can bind to the surface in any arrangement. A previous complex synthesis of different oligonucleotides at certain positions (such as in the hybridization method) is therefore not necessary.
  • the material can be analyzed on a standardized surface.
  • the method is based on several principles:
  • Short nucleotide sequences (10-50 NTs) contain enough information to identify the corresponding gene if the gene sequence itself is already contained in a database.
  • a sequence of, for example, 10 NTs can form more than 10 ⁇ different combinations. For example, this is sufficient for most genes in the human genome, which according to current estimates contains 32,000 genes. The sequence can be even shorter for organisms with fewer genes.
  • the method is based on a new method for sequencing individual nucleic acid chain molecules.
  • the sequencing reaction takes place simultaneously on many molecules, the sequence of each individual bound nucleic acid chain being analyzed.
  • mRNAs or nucleic acid chains derived from the mRNA can be used to investigate gene expression. Regardless of the exact composition, they are referred to below as gene products. Partial sequences of these gene products are also referred to below as gene products.
  • the synthesis is based on the synthesis of a strand that is complementary to the gene product.
  • the aim of the preparation is to provide gene product-primer complexes which are bound in a random manner on a flat surface and on which the incorporation of NT * s by the polymerase can take place (gene product-primer complexes which can be extended).
  • the sequencing reaction is carried out with these bound gene product-primer complexes.
  • a cycle comprises the following steps: a) addition of a solution with labeled nucleotides (NTs * ) and polymerase to bound gene product-primer complexes, b) incubation of the bound gene product-primer complexes with this solution under conditions which extend the complementary strands are suitable for an NT, c) washing, d) detection of the signals from individual modified NTs * molecules incorporated into the newly synthesized strands, e) removal of the label from the built-in nucleotides, f) washing.
  • NTs * labeled nucleotides
  • This cycle can be repeated several times, so that preferably 10 to 50 NTs are determined for each gene product-primer complex participating in the sequencing reaction.
  • the nucleic acid sequences are then reconstructed from the detected signals.
  • the determined sequences of the bound gene products are compared with one another to determine the abundances and are assigned to specific genes by comparison with gene sequences in databases.
  • the sequencing and reconstruction of nucleic acid sequences is based on the shotgun principle ("Automated DNA sequencing and analysis” p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p. 868 , Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257).
  • the sequence of a long piece of DNA is determined by sequencing small DNA fragments and subsequent reconstruction.
  • the material to be analyzed (1) is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length (2). Each fragment is then provided with a primer binding site and a primer (3). This mixture of different DNA fragments is now fixed on a flat surface (4). The unbound DNA fragments are removed by a washing step. The sequencing reaction is then carried out on the entire reaction surface. This reaction is cyclical. In the first step of the cycle, an NT * labeled with a fluorescent dye is incorporated into the growing strand: the reaction is controlled so that only one labeled NT * from a polymerase can be incorporated into the growing strand in each cycle.
  • NTs * which have a reversibly coupled substituent leading to the termination at the 3 "position of the deoxyribose.
  • the incorporation of a further labeled NT * is thereby made impossible.
  • the polymerase and the labeled NTs * become simultaneous (5).
  • the reaction mixture is then removed and washed the surface in a suitable manner (6).
  • a detection step (7) The surface is scanned with a device suitable for single molecule detection (consisting of light source, microscope, camera, scanning table, computer with control and image recognition or image processing software) and the signals of the individual, built-in marked NTs * identified. After the detection step, the marker and the substituent leading to the termination are removed from all built-in NTs * (8).
  • a new cycle can begin.
  • the DNA fragments should be several hundred NT long if the reconstruction is carried out according to the shotgun principle ("Automated DNA sequencing and analysis” p. 231 ff 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257). Since only one marked NT * is installed per cycle, at least 300 cycles are required for sequencing.
  • the aim of the material preparation is to obtain bound single-stranded NSKFs with a length of preferably 50-1000 NTs, a single primer binding site and a hybridized primer (bound NSKF-primer complexes).
  • NSKF primer complexes have, for example, the structure shown in FIG. 2.
  • very variable constructions can be derived from this general structure.
  • here are some examples, whereby the methods listed can be used individually or in combination.
  • NSKs are fragmented in such a way that fragments are obtained which represent overlapping partial sequences of the total sequences. This is achieved by methods in which fragments of different lengths are formed as fission products in a random distribution.
  • the nucleic acid chain fragments can be produced by several methods, for example by fragmentation of the starting material with ultrasound or by endonucleases ("Molecular cloning”. 1989 j.Sambrook et al. Cold Spring Harbor Laborotary Press), such as, for example, by non-specific endonuclease mixtures .
  • ultrasound fragmentation is preferred.
  • the conditions can be set so that fragments with an average Length of 100 bp to 1 kb arise. These fragments are then filled in at their ends by the Klenow fragment (E. coli polymerase I) or by the T4 DNA polymerase ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press).
  • complementary short NSKFs can be synthesized from a long NSK using randomized primers. This method is particularly preferred when analyzing the gene sequences.
  • Single-stranded DNA fragments with randomized primers and a reverse transcriptase are formed on the mRNA (Zhang-J et al. Biochem. J. 1999 v.337 p.231, Ledbetter et al. J.Biol.Chem. 1994 v.269 P.31544, Rolls et al. Anal.Biochem. 1993 v.208 p.264, Decraene et al. Biotechniques 1999 v.27 p.962).
  • the primer binding site is a sequence section which is intended to enable selective binding of the primer to the NSKF.
  • the primer binding sites can be different, so that several different primers must be used.
  • certain sequence segments of the overall sequence can serve as natural PBSs for specific primers. This embodiment is particularly suitable for the investigation of already known SNP sites, see. Example 4 "SNP analysis with sequence-specific primers".
  • the primer binding sites are therefore introduced separately into the NSKFs. In this way, primers with a uniform structure can be used for the reaction. This embodiment will be described in detail below.
  • the composition of the primer binding site is not restricted. Their length is preferably between 20 and 50 NTs.
  • the primer binding site can carry a functional group for immobilizing the NSKF. This functional group can e.g. be a biotin group.
  • FIG. 3a A double-stranded oligonucleotide complex with a primer binding site is used (FIG. 3a). This is ligated to the DNA fragments using commercially available ligases ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press). It is important that only a single primer binding site be ligated to the DNA fragment. This is achieved e.g. by modification of one side of the oligonucleotide complex on both strands (FIG. 3b). The results after the ligation or after subsequent denaturation are shown in FIGS. 3c and 3d. The modifying groups on the oligonucleotide complex can be used for immobilization.
  • oligonucleotide complex can be carried out according to standardized regulations.
  • synthesis e.g. the DNA synthesizer 380 A Applied Biosystems can be used.
  • Oligonucleotides with a certain composition with or without modifications are also commercially available as custom synthesis, e.g. from MWG-Biotech GmbH, Germany.
  • one terminal deoxynucleotidyl transferase can be used for several (e.g. between 10 and 20) attach nucleoside monophosphates to the 3 'end of an SS DNA fragment ("molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology” 1999 v.303, p. 37-38) (FIG. 4), for example several guanosine monophosphates (called (G) n-tailing).
  • the resulting fragment is used to bind the primer, in this example a (C) n primer.
  • Single-stranded NSKFs are required for the sequencing reaction. If the starting material is in double-stranded form, there are several possibilities for producing a single-stranded form from double-stranded DNA (e.g. heat denaturation or alkali denaturation) ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press).
  • the composition and the length of the primer are not restricted.
  • the primer can also perform other functions, such as to create a connection to the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase.
  • sequence-specific primers for the respective primer binding site are used.
  • a primer mixture is used for sequencing.
  • a single primer is used at the primer binding site coupled to NSKFs.
  • the length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs.
  • the primer can carry a functional group which serves to immobilize the NSKF, for example such a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing.
  • the synthesis of such a primer can e.g. can be carried out with the DNA synthesizer 380 A Applied Biosystems or as a custom synthesis from a commercial provider, e.g. MWG-Biotech GmbH, Germany).
  • the primer Prior to hybridization to the NSKFs to be analyzed, the primer can be fixed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology” 2000 M. Schena Eaton Publishing, “DNA Microarrays” 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 p.767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679).
  • the primers are on the surface of microns, for example, in a density of between 10 to 100 microns per 100 2, 100 to 10,000 per 100 2, or 10,000 to 1,000,000 per lOO ⁇ m 2 bound.
  • the primer or mixture of primers is incubated with NSKFs under hybridization conditions, which allow it to bind selectively to the primer binding site of the NSKF.
  • This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the NSKFs to the surface.
  • the optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be according to Rychlik et al. Calculate NAR 1990 v.18 p.6409. In the following, these hybridization conditions are referred to as standardized hybridization conditions.
  • primer binding site with a known structure that is common to all NSKFs is introduced, for example by ligation, primers with a uniform structure can be used.
  • the primer binding site can carry a functional group at its 3 'end which e.g. is used for immobilization.
  • this group is a biotin group.
  • the primer has a structure that is complementary to the primer binding site.
  • the aim of the fixation is to fix NSKF primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the NSKF to the surface.
  • the NSKF primer complexes can first be formed in a solution by hybridization (annealing) and then bound to the surface.
  • NSKFs can then be hybridized to the bound primers, whereby NSKF-primer complexes are formed (NSKFs indirectly bound to the surface)
  • the NSKFs can first be bound to the surface (NSKFs bound directly to the surface) and in the subsequent step the primers can be hybridized to the bound NSKFs, resulting in NSKF-primer complexes.
  • the NSKFs can therefore be immobilized on the surface by direct or indirect binding.
  • the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning.
  • the surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used.
  • the surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
  • this gel can e.g. be an agarose or polyacrylamide gel.
  • the gel is preferably freely passable for molecules with a molecular mass below 5000 Da
  • a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface.
  • the gel is preferably attached to a solid surface
  • This firm base can be silicone, glass, ceramic, Plastic (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material.
  • the thickness of the gel is preferably not more than 0.1 mm.
  • the gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not reach the focal plane and are therefore detected. If the depth of focus is 0.3 ⁇ m, for example, the gel thickness is preferably between 1 ⁇ m and 100 ⁇ m.
  • the surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (eg agarose beads) (FIG. 5b).
  • the reaction surface must be large enough to be able to immobilize the necessary number of NSKFs with the appropriate density.
  • the reaction surface should preferably not be larger than 20 cm 2 .
  • the different cycle steps require an exchange of the different reaction solutions above the surface.
  • the reaction surface is preferably part of a reaction vessel.
  • the reaction vessel is in turn preferably part of a reaction apparatus with a flow device.
  • the flow device enables the solutions in the reaction vessel to be exchanged.
  • the exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out.
  • the volume of the reaction vessel is preferably less than 50 ⁇ l. Ideally, its volume is less than 1 ⁇ l. An example of such a flow system is given in Fig.6.
  • NSKF primer complexes are fixed on the surface via the NSKFs, this can be done, for example, by binding the NSKFs to one of the two chain ends. This can be achieved by appropriate covalent, affine or other bonds.
  • Immobilization of nucleic acids is known (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology” 2000 M. Schena Eaton Publishing, " DNA Microarrays "1999 M. Schena Oxford University Press, Rasmussen et al.
  • the NACFs be on the surface of microns, for example, at a density between 10 and 100 microns NACFs per 100 2, 100 to 10,000 per 100 2, bound 10,000 to 1,000,000 per lOO ⁇ rn. 2
  • the density of NSKF primer complexes which can be extended is necessary for the detection to be approximately 10 to 100 per 100 ⁇ m 2 . It can be achieved before, during or after hybridization of the primers to the gene products.
  • the NSKFs are immobilized via biotin-avidin or biotin-streptavidin binding.
  • Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer contains biotin.
  • the labeled primers After the labeled primers have hybridized with the NSKFs (in solution), they are fixed on the surface coated with avidin / streptavidin.
  • the concentration of the hybridization products labeled with biotin and the time of incubation of this solution with the surface is chosen such that a density suitable for sequencing is already in this step is achieved.
  • the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above).
  • the single-stranded NSKFs, each with one primer binding site per NSKF, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thereby bound (indirect binding), resulting in primer-NSKF complexes.
  • the concentration of the single-stranded NSKFs and the hybridization conditions are chosen such that an immobilization density of 10 to 100 NSKF primer complexes capable of extension per 100 ⁇ m 2 suitable for sequencing is achieved. After hybridization, unbound NSKFs are removed by a washing step.
  • a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 ⁇ m 2 or even higher, since the desired density of NSKF-primer complexes is achieved more quickly, the NSKFs only binding to a part of the primers ,
  • the NSKFs are bound directly to the surface (see above) and then incubated with primers under hybridization conditions.
  • a density of approx. 10 to 100 NSKFs per 100 ⁇ m 2 attempts will be made to prime all available NSKFs and to make them available for the sequencing reaction. This can be achieved, for example, by high primer concentration, for example 1 to 100 mmol / 1.
  • high primer concentration for example 1 to 100 mmol / 1.
  • the density of the NSKF-primer complexes required for optical detection can be achieved during the primer hybridization.
  • the hybridization conditions should be selected so that the primers only bind to a part of the immobilized NSKFs.
  • a blocking solution is preferably applied to the surface before step (a) in each cycle, which serves to avoid non-specific adsorption of NTs * on the surface.
  • an albumin solution (BSA) with a pH between 8 and 10 fulfills these conditions for a blocking solution.
  • thermostable polymerases such as Taq polymerase (GibcoBRL), proHATM polymerase
  • Polymerases with 3 '-5' exonuclease activity can be used (eg Klenow fragment of E. coli polymerase I), provided reaction conditions are selected, suppress the existing 3 '-5' exonuclease activity, such as a low pH Value (pH 6.5) for the Klenow fragment (Lehman and Richardson, J. Biol. Chem. 1964 v.239 p.233) or addition of NaF for the installation reaction.
  • Another possibility is to use NTs * with a phosphorothioate compound (Kunkel et al. PNAS 1981, v.78 p.6734). Built-in NTs * are not attacked by the 3 '-5' exonuclease activity of the polymerase. All these types of polymerases are referred to below as "polymerase”. 4th 5 chemistry
  • NT * s preferably 2'-deoxy nucleotide triphosphates
  • This substituent alone or together with the fluorescent dye, can lead to the termination of the incorporation reaction and can be split off from the nucleotide under mild conditions.
  • a fluorescent dye which is characteristic of the respective NT * is coupled to these substituents, so that the substituent also assumes the role of a linker between the nucleotide and the fluorescent dye.
  • the fluorescent dye is preferably coupled to this linker by a bond which can be cleaved under mild conditions.
  • Standard conditions are understood to mean cleavage conditions which neither lead to denaturation of the primer-nucleic acid complex, nor to the cleavage of its individual components.
  • Formulas (1-3) are examples of the reversible cleavable terminators:
  • NT-3'-0 - represents the 2 'deoxy nucleoside triphosphate residue.
  • S (l) - represents a substituent (Formula 1) that can be split off from the NT * under mild conditions.
  • a fluorescent dye (F) is coupled to these substituents.
  • S (2) -N - represents another substituent (formula 2 and 3), which can be split off from the NT * under mild conditions.
  • This substituent is linked to the fluorescent dye (F) by a group (N) which is cleavable under mild conditions.
  • the fluorescent dye can be coupled directly to the cleavable group (formula 2) or by a further linker (L) (formula 3).
  • Each nucleotide is marked with a characteristic marker (F).
  • the marker is a fluorescent dye. The choice is not restricted if the dye meets the following requirements:
  • the detection apparatus used must have this marker as the only molecule bound to DNA under mild conditions
  • the dyes preferably have great photostability. Their fluorescence is preferably not quenched by the DNA or only to a minor extent.
  • NTs * marked with the dye must be incorporated into the nucleic acid chain by the polymerase. d) When labeled with different dyes, these dyes should not have any significant overlaps in their emission spectra.
  • fluorophores which can be used in the context of the present invention are compiled with structural formulas in "Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes.
  • the following classes of dyes are preferably used as markers: cyanine dyes and their derivatives (for example Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US Pat. No. 5,268,486), rhodamines and their derivatives (for example TAMRA, TRITC, RG6, R110 , ROX, Molecular Probes, see manual), xanthene derivatives (e.g. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US Pat. No. 6,130,101) and porphyrins (Porphyrin-Systems, Germany). These dyes are commercially available.
  • dyes can be selected.
  • the dyes are bound to the NT * via a cleavable linker.
  • the dyes can be attached to the linker e.g. via thiocyanate or ester linkage ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v.278 p.363, Waggoner Methods in Enzymology 1995 v.246 p.362)
  • the substituent leading to the termination is coupled to the NT by a bond which can be split under mild conditions.
  • esters and acetals examples are esters and acetals.
  • the esters are preferably cleaved in the basic pH Range (e.g. 9 to 11). Acetals are split in the acidic range (for example between 3 and 4).
  • Esters can also be eliminated enzymatically by polymerases or esterases.
  • the substituent is split off together with the fluorescent dye in one step.
  • the fluorescent dye is coupled to the substituents by a group which is cleavable under mild conditions.
  • the group mentioned preferably belongs to chemically or enzymatically cleavable or photolabile compounds. Ester, thioester, disulfide compounds and photolabile compounds are particularly suitable as a cleavable connection between the substituent and the fluorescent dye.
  • ester, thioester and disulfide compounds are preferred ( ⁇ Chemistry of protein conjugation and crosslinking "" Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v. 184 S. 584, Lomant et al. J. Mol. Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters” S.Patai 1969 Interscience Publ.).
  • photolabile compounds can be found in the following references: "Protective groups in organic synthesis” 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 Sl, V. Pillai Org. Photochem.
  • the cleavage step is present in every cycle and must take place under mild conditions so that the nucleic acids are not damaged or modified.
  • the cleavage preferably proceeds chemically (for example in a mild acidic or basic environment for an ester compound or by adding a reducing agent, for example dithiothreitol or mercaptoethanol (Sigma) when cleaving a disulfide compound), or physically (for example by illuminating the surface with light a certain wavelength for the cleavage of a photolabile group, thesis ⁇ New photolabile protecting groups for the light-controlled oligonucleotide synthesis "" " H. Giegrich, 1996, Constance).
  • a reducing agent for example dithiothreitol or mercaptoethanol (Sigma)
  • the fluorescent dye is first split off and only then is the substituent which is coupled to the 3 'position and leads to the termination.
  • a cycle can preferably be carried out with:
  • a label with two dyes can be selected. Two pairs of NTs * are formed, each marked differently, eg A and G are marked "X”, C and U are marked "Y”. Two differently labeled NTs * are used simultaneously in the reaction in one cycle (s), for example C * in combination with A * , and U * and G * are then added in the subsequent cycle (n + 1).
  • NT * s are used per cycle and two unmarked NTs (so-called 2NT * s / 2NTs method).
  • This embodiment can be used to determine variants (eg mutations, or alternatively spliced genes) of an already known sequence.
  • the incorporation of NT * s into the NSKFs preferably takes place in such a way that a labeled NT * is incorporated in more than 50% of the NSKFs involved in the sequencing reaction, preferably in more than 90%. This is due to the fact that the reaction takes place very slowly on some nucleic acid chains.
  • An installation of the NTs * at every complementary position in each cycle is aimed for, but is not necessary because only the successful installation reactions are detected and evaluated; a delayed reaction in the subsequent cycle does not lead to a sequencing error.
  • the same polymerase is preferred for all NTs * used. However, different polymerases can also be used for different NTs * .
  • AtomForce microscopy electron microscopy, near-field fluorescence microscopy, wide-field fluorescence
  • fluorescence signals of individual NTs * built into the nucleic acid chain are preferably measured using a wide-field fluorescence microscope (epifluorescence) or a laser scanning microscope (epifluorescence) or a TIRF microscope (Total Internal Reflection Fluorescence Microscope).
  • the device for the excitation light can function, for example, on the basis of a laser, a lamp or diodes.
  • the detection device can serve both CCD cameras and PMT.
  • the detection comprises the following phases:
  • each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the lens (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the Signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective NSKF, d) shift to the next position on the surface.
  • the signals from NTs * built into the NSKFs are registered by scanning the surface.
  • the scanning process can be carried out in various ways ("Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, “New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, “Handbook of biological confocal microscopy” 1995 J. Pavley Plenum Press).
  • a discontinuous scanning process is selected.
  • the objective is moved step by step over the surface (FIG. 8a), so that a two-dimensional image (2D image) is created from each surface position (FIG. 8b, c).
  • This 2D image can be created using various methods: for example by laser scanning a position of the microscope field (laser scanning microscopy) or by Camera recording at one position (see manuals of microscopy).
  • laser scanning microscopy laser scanning microscopy
  • Camera recording at one position see manuals of microscopy.
  • the detection of individual molecules with a CCD camera is described as an example.
  • the positions of the NSKFs must be determined for sequencing so that one has a basis for the assignment of the signals. Knowing these positions allows a statement to be made as to whether the signals of individual molecules come from built-in NTs * or from randomly bound NTs * . These positions can be identified using various methods. In a preferred embodiment, the positions of bound NSKF primer complexes are identified during sequencing. This makes use of the fact that the signals from the NTs * built into the nucleic acid chain always have the same coordinates. This is ensured by fixing the nucleic acid chains. The non-specifically bound NTs * bind randomly at different points on the surface.
  • the signals are checked for agreement of their coordinates from several successive cycles. This can e.g. at the beginning of the sequencing.
  • the matching coordinates are evaluated as coordinates of the DNA fragments and saved.
  • the scan system must be able to scan the surface reproducibly over several cycles.
  • X, Y and Z axis settings at each surface position can be controlled by a computer.
  • the stability and reproducibility of the setting of lens positions in each scanning process determine the quality of the detection and thus the identification of the signals of individual molecules.
  • Signals from individual molecules are placed in relation to the pattern, so that an X, Y deviation in the pattern position means the same X, Y deviation in the position of the signals of individual molecules.
  • the control image of the pattern can be taken before, during or after the detection of individual molecules. Such a control picture must be made accordingly with each setting on a new surface position.
  • the surface is not absolutely flat and has various unevenness. This changes the surface-lens distance when scanning neighboring locations. These differences in distance can lead to individual molecules leaving the focal plane and thus avoiding detection.
  • the following method can be used: Since the excitation of individual molecules can lead to the extinction of their fluorescence, a marker is applied to the surface, which serves to adjust the focal plane. The signals of individual molecules are then detected.
  • the marker can be of any nature (eg dye or pattern), but must not interfere with the detection and the reaction.
  • the two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information from NT * s built into the NSKFs. Before further processing, these must be extracted from the total amount of image information using suitable methods.
  • the algorithms required for scaling, transforming and filtering the image information are part of the standard repertoire of digital image processing and pattern recognition (Haberburger P. "Practice of digital image processing and pattern recognition”. Hanser-Verlag, Kunststoff, Vienna, 1995; Galbiati LJ “Machine vision and digital image processing fundamentals ". Prentice Hall, Englewood Cliffs, New Jersey, 1990).
  • the signal extraction is preferably carried out via a gray value image, which depicts the brightness distribution of the reaction surface for the respective fluorescence channel.
  • a separate gray value image can first be generated for each fluorescence-labeled nucleotide (A, T, C, G or U).
  • A, T, C, G or U fluorescence-labeled nucleotide
  • a gray value image is generated for each fluorescence channel by using suitable filters (Zeiss filter sets).
  • the relevant color channels are extracted from a recorded multichannel color image with the aid of a suitable algorithm by an image processing program and are individually processed further as a gray-scale image.
  • a channel-specific color threshold algorithm is used for channel extraction.
  • the relevant image information is then extracted from this amount of data by a suitable program.
  • a suitable program should implement the following steps:
  • Preprocessing of the image for example, if necessary, reducing the image noise caused by the digitization of the image information, for example by gray value smoothing.
  • a pixel (x, y) fulfills these requirements, then a comparison with the coordinates of NSKFs identified in previous sequencing cycles follows. If there is a match, the signal is assigned to the nucleotide resulting from the respective fluorescence channel NACF. Signals with mismatched coordinates are evaluated as background signals and rejected. The signals can be analyzed in parallel with the scanning process.
  • an 8-bit gray value image with a resolution of 1317 x 1035 pixels was used.
  • the overall image was first preprocessed: the average value of the brightness of its 8 neighbors was assigned to each pixel. With the selected resolution, this results in a typical pattern for a fluorescence dot of a central pixel with the greatest brightness value and neighboring pixels with brightness decreasing on all sides. If a pixel met these criteria and the centrifugal drop in brightness exceeded a certain threshold value (to exclude fluorescence spots that were too weak), this central pixel was evaluated as the coordinate of a fluorescence spot.
  • a sequence of recordings can be made with the control of the X, Y position, the adjustment of the focal plane and with the detection of individual molecules at each new lens position. These steps can be controlled by a computer.
  • the scanning process and the biochemical reaction take a certain amount of time. If you switch these processes one after the other, you can achieve an optimal performance of the equipment. In a preferred embodiment, the response to performed two separate surfaces.
  • a surface with bound NSKF primer complexes can be separated into two spatially isolated parts, so that reactions on these two parts can take place independently of one another.
  • NSKFs can also be immobilized on two separate surfaces from the outset.
  • the reaction is then started.
  • the principle is that while the reaction and washing steps take place on part of the surface, the second part is scanned. This enables the analysis to run continuously and the speed of sequencing to be increased.
  • the number of surfaces on which the reaction takes place can also be greater than 2. This makes sense if the reaction occurs as a time-limiting step, i.e. the detection of the signals on the surface is faster than the reaction and washing steps. In order to adapt the total duration of the reaction to the detection duration, each individual step of the reaction can take place on a single surface with a time delay compared to the next surface.
  • all four NTs * used in the reaction are labeled with fluorescent dyes.
  • the sequencing of long nucleic acid chains will be shown schematically on the basis of the sequencing of a 1Mb piece of DNA (FIG. 1).
  • the sequencing is based on the shotgun principle ("Automated DNA sequencing and analysis” p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v .33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257).
  • the material to be analyzed is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length.
  • each fragment is then provided with a primer binding site and a primer.
  • This mixture of different DNA fragments is now fixed on a flat surface.
  • the unbound DNA fragments are removed by a washing step.
  • the sequencing reaction is then carried out on the entire reaction Surface performed.
  • the sequences of NSKFs should preferably be longer than 300 NTs, on average approx. 400 bp. Since only one marked NT * is installed per cycle, at least 400 cycles are required for sequencing.
  • the NSKF sequences determined represent a population of overlapping partial sequences which can be combined with commercially available programs to form the overall sequence of the NSK ("Automated DNA sequencing and analysis” p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl S. 257).
  • sequences can be analyzed in one approach instead of one sequence.
  • the original sequences can be extracted from the raw data e.g. be reconstructed according to the shotgun principle.
  • NSKFs are created. For example, one can convert mRNA into a double-stranded cDNA and fragment this cDNA with ultrasound. These NSKFs are then provided with a primer binding site, denatured, immobilized and hybridized with a primer. It should be noted with this variant of the sample preparation that the cDNA molecules can represent incomplete mRNA sequences (Method in Enzymology 1999, v.303, p.19 and other articles in this volume, "cDNA library protocols" 1997 Humana Press).
  • NSKFs single-stranded NSKFs from mRNA
  • Another possibility for the generation of single-stranded NSKFs from mRNA is the reverse transcription of the mRNA with randomized primers.
  • Many relatively short antisense DNA fragments are formed (Zhang-J et al. Biochem. J. 1999 v.337 p.231, Ledbetter et al. J.Biol.Chem. 1994 v.269 p.31544, Rolls et al Anal.Biochem. 1993 v.208 p.264, Decraene et al. Biotechniques 1999 v.27 p.962).
  • These fragments can then be provided with a primer binding site (see above). Further steps correspond to the processes described above. With this method, complete mRNA sequences (from the 5 'to the 3' end) can be analyzed, since the randomized primers bind over the entire length of the mRNA.
  • Immobilized NSKFs are analyzed using one of the sequencing embodiments listed above. Since mRNA sequences have significantly fewer repetitive sequences than, for example, genomic DNA, the number of signals detected by the built-in NTs * from an NSKF can be less than 300 and is preferably between 20 and 1000. The number of NSKFs that need to be calculated is calculated following the same principles as a shot-shot reconstruction of a long sequence.
  • the original gene sequences are reconstructed from NSKF sequences according to the principles of the shotgun method.
  • This method allows the sequencing of many mRNAs without prior cloning.
  • NSKFs are sequenced using the method according to the invention, wherein both a uniform primer and a uniform primer binding site as well as different, sequence-specific primers and natural ones which occur in the overall sequence to be investigated
  • NSKFs can use primer binding sites.
  • the determined sequences of NSKFs are then not assembled using the shotgun method, but are compared with the reference sequence and in this way assigned to their positions in the full sequence. This can be genomic or cDNA sequences.
  • the length of the NSKF sequences determined should be sufficient for an unambiguous assignment to a specific position in the reference sequence, for example sequences with a length of 20 NTs (e.g. from non-repetitive sections in the human genome) can be clearly identified. Longer sequences are required for the comparative analysis of the repetitive sections. The exact length of the sequences depends on the task.
  • the length of the NSKF sequences determined is preferably more than 20 NTs when analyzing non-repetitive sections. For the analysis of the repetitive sections, it is preferably over 500 NTs.
  • the objectives when sequencing new variants of an already known full sequence can be very different.
  • a comparison of the newly determined sequence with the known full sequence / reference sequence is usually sought.
  • the two sequences can originate from species that are evolutionarily different from one another. Different parameters of the composition of these two sequences can be compared. Examples of such an analysis are: mutation or polymorphism analyzes and the analysis of alternative spliced gene products.
  • a long sequence to be analyzed is shared in NSKFs using one of the above methods.
  • These NSKFs are sequenced using uniform primers using the method according to the invention.
  • the sequences determined from each individual NSKF are compared directly with the reference sequence.
  • the reference sequence serves as the basis for the assignment of determined NSKF sequences, so that the time-consuming reconstruction using the shotgun method is not necessary.
  • the length of the NSKF sequences determined is preferably more than 20 NTs when analyzing non-repetitive sections. For the analysis of the repetitive sections, it is preferably over 500 NTs.
  • the number of NSKFs to be analyzed depends on the total length of the sequence to be examined, the average length of the NSKF sequences and the necessary accuracy of the sequencing.
  • a total length of the sequence to be examined of 1 Mb and an accuracy that corresponds to the raw sequence determination (i.e. each location should be sequenced only once if possible), e.g. approx. 5 times the amount of raw sequences, i.e. 5 Mb because the NSKFs are randomly distributed over the entire sequence.
  • a total of 50,000 NSKFs must be analyzed to cover more than 99% of the total route.
  • NSKF sequences are then assigned to the full sequence using a commercially available program and any deviations are detected.
  • a program can be based on, for example, BLAST or FASTA algorithm ("Introduction to computational Biolögy "1995 MS Waterman Chapman & Hall)
  • 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
  • This method is particularly suitable for analyzing the sequence variants (e.g. SNP or mutation analysis) and requires knowledge of a reference sequence.
  • the full sequence is not reconstructed, but the determined sequences are assigned to the reference sequence using a program and any deviations are registered.
  • a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall).
  • This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence.
  • the determined sequence is compared with the reference sequence and assigned to a specific position, for example:
  • NSKFs The unknown variant of the reference sequence to be analyzed is prepared for sequencing as described above (NSK is converted into NSKFs, these are ligated with PBS, then hybridized with a primer and immobilized on the reaction surface). NSKFs prepared in this way are sequenced using the 2NTs * / 2NTs method. NSKF sequences are obtained, each NSKF sequence being a sequence of 2NTs * . In order to enable the determined sequence to be clearly assigned to a known reference sequence, this sequence must be long enough. The length of the NSKF sequences determined is preferably more than 40 NT * s.
  • the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 40 detected NTs * , the total length is z, e.g. 80 NTs on average).
  • NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
  • a cycle in this embodiment may look as follows, for example:
  • This 2NT * s / 2NTs method is suitable, for example, for the SNP analysis of a genomic stretch of a gene or for double-stranded cDNA analysis. It is based on the following principles:
  • NT * s permissible combinations of NT * s in this embodiment are: A * C * ; A * G * ; C * T * / C * U * ; G * T * / G * U * .
  • the combination C * and U * is preferred.
  • the NSKFs come from both strands of the NSK to be analyzed and • the NSKF sequences determined cover the entire length of the sequence to be analyzed.
  • the sequence to be checked is sequenced using the 2NT * s / 2NTs method, so that a population of NSKF sequences (determined NSKF sequences (n)) is formed.
  • the NSKF sequences determined contain information from each strand:
  • a comparison sequence (reference sequence) is required for analysis:
  • NSKF sequences are assigned to specific points in the comparison sequence and possible deviations are detected:
  • a double-stranded nucleic acid can be examined for SNP or mutations.
  • the NSKF sequences determined are compared with a reference sequence compared.
  • the basic rules of comparing a partial sequence and a complete sequence in the analysis with only 2 marked NTs do not differ fundamentally from those that apply when comparing the sequences using all 4 marked NTs * .
  • Sequence comparison in mutation analysis and SNP analysis with 4NTs * See Example 1B).
  • the basic principles of the sequencing reaction in gene expression analysis correspond to those of the sequencing reaction of long NSKs (Fig. 7).
  • the basic principles for carrying out a reaction cycle (the choice of the NT * structure, the polymerase, the reaction conditions for the NT * incorporation reaction and the cleavage reaction) and for the detection of the signals from built-in NT * correspond to those in the process for sequencing long NSKs.
  • the main differences between the two methods lie in the selection and preparation of materials and the processing of the data obtained.
  • Gene products can come from various biological objects, e.g. of individual cells, cell populations, a tissue or of entire organisms.
  • Biological fluids such as blood, sputum or cerebrospinal fluid can also serve as a source of the gene products.
  • the methods for obtaining the gene products from the various biological objects can be found, for example, in the following literature sources: "Molecular cloning” 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, “Method in Enzymology” 1999, v303, "cDNA library protocols” 1997, Ed. I. G. Cowell, Humana Press Inc.
  • Both the entirety of the gene products isolated and a part thereof selected by preselection can be used in the sequencing reaction.
  • preselection one can determine the amount of the to be analyzed Reduce gene products ' .
  • the preselection can be carried out, for example, by means of molecular biological methods such as, for example, PCR amplification, gel separation or hybridization with other nucleic acid chains ("Molecular cloning” 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, “Method in Enzymology” 1999, v303, "cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.)
  • the entirety of the gene products is preferably selected as the starting material.
  • the aim of the preparation of the material is to form extensible gene product-primer complexes from the starting material that are bound to the surface. Whereby only a maximum of one primer should bind per gene product.
  • PBS Priming site
  • a primer binding site is a sequence section which is intended to enable selective binding of the primer to the gene product.
  • Sections in the nucleic acid sequence that naturally occur in the sequences to be analyzed can serve as primer binding sites (e.g. polyA stretches in mRNA).
  • a primer binding site can also be introduced into the gene product (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory,” Method in Enzymology “1999, v303,” cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc. ).
  • primer binding site that is as uniform as possible in all gene products. Then primers with a uniform structure can be used in the reaction.
  • the composition of the primer binding site is not limits. Their length is preferably between 10 and 100 NTs.
  • the primer binding site can carry a functional group, for example to bind the gene product to the surface. This functional group can be, for example, a biotin or digoxigenin group.
  • nucleotide tailing of antisense cDNA fragments is described as an example of the introduction of a primer binding site into the gene products.
  • cDNAs are synthesized from mRNAs.
  • the result is a population of cDNA molecules that represent a copy of the mRNA population, so-called antisense cDNA.
  • antisense cDNA Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory,” Method in Enzymology “1999, v303,” cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.).
  • a terminal deoxynucleotide transferase one can do several ( for example between 10 and 20) attach nucleoside monophosphates to the 3 'end of this antisense cDNA, for example several adenosine monophosphates (called ((dA) n-tail).
  • the resulting fragment is used to bind the primer, in this example one (dT ) n-primers used ("Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology” 1999 v.303, pp. 37-38).
  • Primer for the secretion reaction This has the function of enabling starting at a single point in the gene product. It preferably binds to the primer binding site in the gene product.
  • the composition and the length of the primer are not restricted. In addition to the start function, the primer can also perform other functions, such as creating a connection between the gene product-primer complexes and the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase.
  • the length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs.
  • the primer can carry a functional group which is used, for example, to bind the primer to the surface, for example such a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing.
  • a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing.
  • the synthesis of such a primer can be carried out, for example, with the 380 A Applied Biosystems DNA synthesizer or can be created as a custom synthesis from a commercial provider, for example MWG-Biotech GmbH, Germany.
  • primers can also be used, a defined primer set, or a primer mixture.
  • the primer Before hybridization, the primer can be fixed to the fragments to be analyzed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology” 2000 M. Schena Eaton Publishing, “DNA Microarrays” 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 p.767, Timofeev et al. Nucleic Acid Research (NAR) 1996 , v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679).
  • the primers are on the surface at a density between 10 to 100 microns per 100 2, 100 to 10,000 per 100 micron 2, bound 10,000 to 1,000,000 per lOO ⁇ m 2 or greater than 1,000,000 per 100 microns. 2
  • the primer or mixture of primers is incubated with gene products under hybridization conditions that selectively bind it to the primer binding site of each gene product.
  • This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the gene products to the surface respectively.
  • gene products are present as double-stranded nucleic acids, they are denatured by heat before hybridization ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press).
  • the optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be done according to Rychlik et al. (NAR 1990 v.18 p.6409). In the following, these hybridization conditions are referred to as standardized hybridization conditions.
  • an oligo-dT primer can be used.
  • a primer mixture consisting of 12 different primers with the following general structure 5 '(K) n MN3' can also be used. Where (n) is between 10 and 50, preferably between 20 and 30.
  • K stands for dT or dU
  • M and “N” each stand for dA, dT or dU, dC, dG (e.g.
  • the aim of the fixation is to fix gene product-primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the gene product to the surface.
  • the order of the steps in binding gene product-primer complexes can be variable:
  • the gene product-primer complexes can first be formed in a solution by hybridization (annealing) and then be bound to the surface.
  • Primers can first be bound to a surface and gene products can then be hybridized to the bound primers, producing gene product-primer complexes (gene products indirectly bound to the surface)
  • the gene products can first be bound to the surface (gene products bound directly to the surface) and in the subsequent step the primers can be hybridized to the bound gene products, producing gene product-primer complexes.
  • the gene products can therefore be immobilized on the surface by direct or indirect binding.
  • the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning.
  • the surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used.
  • the surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
  • this gel can be, for example, an agarose or polyacrylamide gel.
  • the gel is preferably freely passable for molecules with a molecular mass below 5000 Da (for example, a 1 to 2% agarose gel or 5 to 15% polyacrylamide gel can be used).
  • Such a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface.
  • Primer complexes on the surface make it possible to detect the fluorescence signals from built-in NTs * .
  • the signals from free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized.
  • the gel is preferably attached to a solid surface.
  • This solid base can be silicone, glass, ceramic, plastic (for example polycarbonate or polystyrene), metal (gold, silver or aluminum) or any other material.
  • the thickness of the gel is preferably not more than 0.1 mm. However, the gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not get into the focal plane and are therefore detected. If the depth of focus is 0.3 ⁇ m, for example, the gel thickness is preferably between 1 ⁇ m and 100 ⁇ m.
  • the surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (eg agarose beads). The reaction surface must be large enough to be able to bind the necessary number of gene products with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
  • the different cycle steps require an exchange of the different reaction solutions above the surface.
  • the reaction surface is preferably part of a reaction vessel.
  • the reaction vessel is in turn preferably part of a reaction apparatus with a flow device.
  • the flow device enables the solutions in the reaction vessel to be exchanged.
  • the exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out.
  • the volume of the reaction vessel is preferably less than 50 ⁇ l. Ideally, its volume is less than 1 ⁇ l.
  • the gene product-primer complexes are fixed on the surface via the gene products, this can for example by binding the gene products at one of the two chain ends. This can be achieved by appropriate covalent, affine or other bonds.
  • immobilization of nucleic acids are known (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology” 2000 M. Schena Eaton Publishing, “DNA Microarrays” 1999 M. Schena Oxford University Press, Rasmussen et al.
  • the fixation can also be achieved by a non-specific binding, for example by drying out the sample containing gene products on the flat surface.
  • the gene products are bound to the surface at a density between 10 and 100 microns per 100 2, 100 to 10,000 per 100 micron 2, 10,000 to 1000,000 per lOO ⁇ m. 2
  • the density of extensible gene product-primer complexes required for the detection is approx. 10 to 100 per 100 ⁇ m 2 . It can be achieved before, during or after hybridization of the primers to the gene products.
  • the gene product-primer complexes are bound via biotin-avidin or biotin-streptavidin binding.
  • Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer is modified with biotin. After hybridization of the modified primers with the gene products (in solution), these are fixed on the surface coated with avidin / streptavidin.
  • concentration of the gene product primer labeled with biotin Complexes as well as the time of incubation of this solution with the surface are chosen in such a way that a density suitable for sequencing is achieved.
  • the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above).
  • the single-stranded gene products, each with one primer binding site per gene product molecule, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thus bound to the surface (indirect binding).
  • the concentration of the single-stranded gene products and the hybridization parameters eg temperature, time, buffer
  • the concentration of the single-stranded gene products and the hybridization parameters are selected so that a density of approximately 10 to 100 gene product-primer complexes capable of extension per 100 ⁇ m 2 is achieved which is suitable for sequencing.
  • unbound gene products are removed by a washing step.
  • a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 ⁇ m 2 or even higher, since the desired density of gene product-primer complexes is achieved more quickly, the gene products binding only to a part of the primers ,
  • the gene products are bound directly to the surface (see above) and then incubated with primers under hybridization conditions.
  • a density of approx. 10 to 100 gene products per 100 ⁇ m 2 attempts will be made to provide all available gene products with a primer and to make them available for the sequencing reaction. This can be achieved by high primer concentration, for example 1 to 100 mmol / 1.
  • high primer concentration for example 1 to 100 mmol / 1.
  • the density of the gene product-primer complexes required for optical detection can be achieved during the primer hybridization.
  • the hybridization conditions e.g. temperature, time, buffer, Primer concentrate
  • a blocking solution is preferably applied to the surface before step (a) in each cycle, which serves to avoid non-specific adsorption of NTs * on the surface.
  • an albumin solution (BSA) with a pH between 8 and 10 fulfills these conditions for a blocking solution.
  • RNA or DNA The type of immobilized nucleic acid (RNA or DNA) used plays a decisive role in the choice of polymerase:
  • RNA-dependent DNA polymerases can be used, e.g. AMV reverse transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNAse activity. All reverse transcriptases must be largely free of RNAse activity ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory).
  • DNA is used as a gene product (eg cDNA)
  • all DNA-dependent DNA polyases without 3 "-5" exonuclease activity are suitable in principle as polymerases.
  • T7 polymerase of the "Sequenase Version 2" type (Amersham Pharmacia Biotech), Klenow fragment of DNA polymerase I without 3 '-5' exonuclease activity (Amersham Pharmacia Biotech), polymerase beta of various origins (animal cell DNA polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHA DNA polymerase (Eurogentec). detection:
  • the detection comprises the following phases:
  • each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the objective (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the signals of individual people Molecules, assignment of the signal to NT * and assignment of the signal to the respective gene product, d) shift to the next position on the surface.
  • the signals from NTs * built into the strands complementary to the gene products are registered by scanning the surface.
  • the scanning process is carried out as with the sequencing of long NSKs.
  • the lens is gradually moved over the surface, so that a two-dimensional image (2D image) is created from each surface position.
  • the exact number depends e.g. on the relative presence of the gene products in the approach and on the desired accuracy of the analysis.
  • the number of gene products analyzed is preferably between 1000 and 10,000,000. For highly expressed genes, the number of gene products analyzed can be low, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or even further.
  • the data obtained are compared using a program with known gene sequences.
  • a program can e.g. based on a BLAST or FASTA algorithm ("Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall).
  • the choice of the method for material preparation determines, among other things, in which sections of the gene products the sequences are determined and to which strand (sense or antisense) they belong. For example, are determined when using the polyA stretches as primer binding sites in mRNA sequences from NTRs (non-translating regions). When using the method with antisense cDNA as a template, the sequences determined come, inter alia, from the protein-coding regions of the gene products.
  • the gene expression is only determined qualitatively. Only the fact that certain genes are expressed is important.
  • a quantitative determination of the relationships between individual gene products in the batch is of interest. It is known that the activity of a gene in a cell is represented by a population of identical mRNA molecules. Many genes are active in a cell at the same time and are expressed to different extents, which leads to the presence of many different mRNA populations with different strengths. The quantitative analysis of gene expression is discussed in more detail below:
  • the number of gene products analyzed is preferably between 1000 and 10,000,000.
  • the exact number of gene products to be analyzed depends on the task. It can be low for highly expressed genes, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or higher.
  • RNA control samples are used in the sequence analysis of the mRNA samples, and corresponding DNA control samples are used in the analysis of the cDNA samples. These samples are preferably carried along in all steps. she can be added after mRNA isolation, for example. In general, the control samples are prepared for sequence analysis in the same way as the gene products to be analyzed.
  • control sequences are added to the gene products to be analyzed in known, fixed concentrations. Concentrations of the control samples can be different, these concentrations are preferably between 0.01% and 10% of the total concentration of the sample to be analyzed (100%). For example, if the concentration of the mRNA is 10ng / ⁇ l, the concentrations of control samples are between 1pg / ⁇ l and 1ng / ⁇ l.
  • the change in the level of expression of a particular gene can occur as a result of the change in the transcription rate of that gene or as a result of a global change in gene expression in the cell.
  • the expression of the so-called "house-keeping genes" can be analyzed to observe the metabolic states in the cell. In the absence of important metabolites, for example, the general level of expression in the cell is low, so that constitutively expressed genes also have a low level of expression.
  • all constitutively expressed genes can serve as "house-keeping genes". Examples include the transferrin receptor gene or the beta actin gene. The expression of these house-keeping genes thus serves as
  • House-keeping genes are preferably part of the analysis program for gene expression.
  • all four NTs * used in the reaction are labeled with fluorescent dyes.
  • the number of NTs determined for each sequence from a gene product is between 5 and 100, ideally between 20 and 50. These sequences are compared with a sequence with known sequences in gene databases and assigned to corresponding genes. Such a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
  • a cycle has the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains, b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) Washing d) Detection of signals from individual molecules e) Removal of the label from the built-in nucleotides and that leading to the termination Substituents, f) washing.
  • NTs * labeled nucleotides
  • 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
  • This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence.
  • the determined sequence is compared with the reference sequence and assigned to a specific position, for example:
  • the ascertained sequences are preferably assigned to the reference sequence with the aid of a program.
  • a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall).
  • the gene products are prepared for sequencing as described above and sequenced using the 2NTs * / 2NTs method. Sequence sections are obtained from gene products, each sequence representing a sequence of 2NTs * .
  • Known gene sequences serve as reference sequences. To be clear To enable the determined sequence to be assigned to a known reference sequence, this sequence must be long enough.
  • the length of the sequences determined is preferably more than 20 NT * s. Since 2 marked NTs * represent only part of the sequence, the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 20 detected NTs * , the total length is, for example, an average of 40 NTs).
  • NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
  • a cycle in this embodiment may look as follows, for example:
  • the concentration of the NTs is preferably below 1 M, ideally below 10 ⁇ M.
  • a special embodiment of the method is the analysis of single nucleotide polymorphisms with sequence-specific primers.
  • Primer - In order to clarify the Indian idea, the following terms are distinguished in this example: a) In the present case, a “primer” is generally understood to mean a population of primer molecules with a uniform structure Understand primer molecules that have different structures. C) A “primer molecule” means a single oligonucleotide molecule. D) ⁇ Several primer molecules ⁇ j ⁇ mean several individual oligonucleotide molecules; they can have a uniform or different structure.
  • SNP position - a position in NSK that is checked for the presence or absence of SNP.
  • Target Sequence Part of an overall sequence that is sequenced / determined using a specific primer in the sequencing reaction.
  • a Entire sequence can contain several target sequences.
  • a target sequence is long enough to ensure that it is very likely to be positioned within the overall sequence.
  • Target sequences can contain one or more SNP sites, for example.
  • Detection Sequence Part of the target sequence that is used to assign this target sequence to the overall sequence.
  • SNP analysis For SNP analysis, several potential SNP positions in the reference sequence are selected which are examined in an NSK to be analyzed. Accordingly, different, sequence-specific primers are provided for these positions. These primers can form a standardized primer set for SNP analysis for a specific question and can be used as a kit for the relevant analyzes.
  • the preparation of the material to be analyzed has the aim according to the invention of creating a population of relatively small, between 30 and 2000 NT long, single-stranded nucleic acid chain fragments (NSKFs) from one or more long nucleic acid chains (overall sequence) form.
  • NNKFs single-stranded nucleic acid chain fragments
  • NSKF molecules happen to be random on a flat surface with a density between 10 and 1,000,000 per 100 ⁇ m 2 , preferably 10 and 100 NSKFs per 100 ⁇ m 2 , 100 to 10,000 per 100 ⁇ m 2 or 10,000 to 1,000,000 per 100 ⁇ m 2 immobilized.
  • Primers are hybridized to the NSKFs bound on the surface, so that the density of the NSKF primer complexes capable of extension is approximately 10-100 per 100 ⁇ m 2 . After hybridization, unbound primers are removed and the sequencing reaction started.
  • Sections of the overall sequence examine what reduces the amount of irrelevant information and shortens the analysis time.
  • SNPs single nucleotide polymorphisms
  • each SNP site to be examined either occupies the next position in the 3 g direction from the primer or within 2 to 100, preferably 2 to 50, ideally 2 to 20 positions in the 3 ⁇ direction from the primer.
  • the SNP site is thus within the target sequence that is determined during the sequencing reaction.
  • Several SNP sites are preferably analyzed simultaneously, so that several specific primers have to be used.
  • the primers are preferably selected so that they have annealing temperatures that are as uniform as possible, i.e. Differences between melting temperatures of individual primer populations are, for example, within a range of approximately 4 degrees, better within 2 degrees, even better within 1 degree.
  • NNKFs Short nucleic acid chain fragments
  • NSKF molecules are arranged in a random order immobilized on the surface.
  • a cyclic sequencing reaction is carried out, a target sequence being determined for each NSKF molecule involved in the reaction.
  • the sequencing reaction takes place on many molecules simultaneously.
  • the determined target sequences contain information about the affiliation to a certain section in the overall sequence and about the SNP in this section for the sample to be examined.
  • the length of the target sequences and thus the number of cycles should be selected so that an identification of the sequences can be guaranteed.
  • the determined target sequences are compared with the reference sequence and assigned by sequence matching. If the target sequence is sufficiently long, it is very likely that it can be assigned to a specific position in the reference sequence. For example, a sequence of 10 NTs can form more than 10 ⁇ different combinations and can therefore be identified with a high probability in an NSC of only 100,000 NT. After assigning the determined target sequence to the specific position within the reference sequence, differences in the sequences, the SNPs, become visible.
  • the already known number of primers, their composition and an already known sequence section of the reference sequence which adjoins the primer binding site are used to identify the target sequences used.
  • the target sequences determined are analyzed according to their affiliation with the primers, only the sequences close to the primer binding site having to be taken into account. If, for example, only 1000 primers are used, fewer than 10 NTs of the determined target sequences are sufficient to enable an assignment to the corresponding primers.
  • the sample to be analyzed usually contains several identical total sequence molecules, e.g. multiple copies of genomic DNA from cells of a tissue or multiple identical mRNA populations from cells of a tissue.
  • the method according to the invention can be used to analyze known SNP positions as well as to determine new SNP positions. Any position in the NSK can appear as a potential SNP position. The selection depends on the question, e.g. SNP analysis in genes whose products are associated with certain diseases, or SNP analysis in conserved, coding sections of the genes that code for membrane receptors, or checking known SNP sites in regulatory sequences of genes that are important for cell division.
  • An SNP site to be analyzed lies within a target sequence that is determined during the sequencing reaction. You can identify multiple SNP locations within a target sequence. On the other hand, one can also select several target sequences, for example within one gene. It is important that the target sequences are at a sufficient distance from one another in the overall sequence. This distance is necessary so that only one sequence-specific primer hybridizes per NSKF, and it depends on the average NSKF length: the shorter the NSKFs, the closer the target sequences can be. With an appropriate choice of primers, the SNP sites can do both Strands of a double-stranded nucleic acid chain are analyzed.
  • the method also offers the possibility, for example, of controlling several SNP positions from many individuals (as a sample of a population) at the same time. This can e.g. the SNP profile of a population are examined.
  • Sequencing reaction on a single NSKF molecule is made possible by a primer molecule.
  • a sequence-specific primer is necessary in order to be able to carry out the sequencing reaction in each case on a specific / specific target sequence within the overall sequence.
  • the sequence-specific primer to be used for the analysis of an SNP site or a target sequence represents a population of primer molecules with an identical structure. Several different primer populations are necessary for the analysis of several different target sequences.
  • sequence-specific primers By using sequence-specific primers, only the relevant sequence segments, the target sequences, are analyzed. In the method according to the invention, the length of the sequences to be sequenced is kept as short as possible so that the speed of the analysis increases.
  • a sequence-specific primer binds to a specific primer binding site in the sequence to be analyzed, PBS.
  • the composition and length of the primers are optimized for each potential SNP site or target sequence. Examples of optimization steps are in Rychlik et al. NAR 1990 v.18 p.6409 shown.
  • the SNP position to be analyzed should either be the same after the 3 'end of the primer or within the next 2 to 50 NTs, preferably 2 to 20 NTs.
  • the positioning (the choice of the sequence length and the composition) of the PBS to the SNP site should take place in such a way that the different PBS sequences and the corresponding primer sequences have as similar as possible "annealing temperatures" in order to achieve the most uniform hybridization conditions possible tie. This can be done, for example, by changing the PBS position in relation to the respective SNP site to be analyzed or by changing the length of the primer sequence (Rychlik et al. NAR 1990 v.18 p.6409).
  • the minimum distance between primers that bind to the same strand in the overall sequence should not be less than the average NSKF length.
  • Primers can be used for both strands of a double-strand NSK. This makes it possible, for example, to record SNP points that are close to one another, or to check an SNP point in both lines.
  • the length of the primer is preferably between 6 and 100 NTs, optimally between 10-30 or 30-40 or 40-50. Primers with different lengths can be used for different SNP sites or target sequences.
  • primers are hybridized according to the invention in a hybridization solution to the NSKFs immobilized on the reaction surface (annealing reaction).
  • the NSKF primer complexes are bound to the surface exclusively via the NSKFs (direct binding of NSKFs to the Surface), the NSKF molecules provided being bound to the flat surface in a random arrangement.
  • the NSKFs are preferably immobilized at one of the two chain ends (see above).
  • the immobilization can also be achieved by a non-specific binding, for example by drying out the sample containing NSKFs on the flat surface.
  • the density of the immobilization can be between 10 and 100, 100 and 10,000, 10,000 and 1,000,000 NSKFs per 100 ⁇ m 2 .
  • the bound NSKFs and the primers are incubated under stringent hybridization conditions which allow the primers to be linked as selectively as possible (annealing) to the corresponding primer binding sites of the NSKFs.
  • Optimal hybridization conditions depend on the exact structure of the primer binding sites and the respective primer structures and can be determined, for example, according to Rychlik et al. Calculate NAR 1990 v.18 p.6409.
  • the primers are preferably a mixture of primers.
  • concentrations of individual sequence-specific primers are, for example, between 10 pmol / l and 1 mmol / 1, preferably between 0.1 ⁇ mol / l and 10 ⁇ mol / l.
  • the total concentration of primers in the primer mixture is preferably between 1 mol / 1 and 10 mmol / l.
  • the ratio between individual primer populations can vary. Primers can be added in a significant excess over the immobilized NSKFs, so that the hybridization time is short.
  • the density of NSKF primer complexes which can be extended is necessary for the detection to be approximately 10 to 100 per 100 ⁇ m 2 . It can be achieved before, during or after hybridization of the primers.
  • the immobilization conditions can be selected such that the NSKFs are bound in a density of approx. 10 to 1000 molecules per 100 ⁇ m 2 . NSKFs thus determine the density of the NSKF primer complexes.
  • the density of the immobilized NSKFs can be substantially higher than 1000 NSKFs per 100 ⁇ m 2 , for example 1,000,000 per 100 ⁇ m 2 .
  • the density of the NSKF primer complexes required for optical detection is achieved during the primer hybridization.
  • the hybridization conditions eg temperature, time, buffer
  • the hybridization (annealing) of primers to the NSKFs can lead to a higher than optimal density of NSKF-primer complexes.
  • part of the sample containing NSKFs is used to determine the optimal density.
  • This part is immobilized on a reaction surface, the primers are hybridized to the NSKFs and the resulting NSKF-primer complexes are marked by the incorporation of fluorescent dye-bearing NT * s (eg Cy3-dCTP, Amersham Pharmacia Biotech).
  • the density determined can be used to calculate the dilution or concentration of the original sample that may be necessary for the final sequencing approach (the hybridization conditions are maintained).
  • necessary changes in the hybridization conditions can be calculated from this, for example a shortening of the hybridization time, the NSKF immobilization density remaining constant.
  • the quantity ratio between primer populations can be different or the same size. A higher primer concentration makes it possible to bind certain, for example rarer, sequences with a higher probability in a certain period of time.
  • the great advantage of the described process arrangement compared to a process arrangement with sequence-specific primers immobilized on a surface and a subsequent hybridization of samples to these primers is the significant reduction in the time for hybridization (annealing) between the sequence-specific primers and the samples to be analyzed on the reaction surface.
  • NNKs long nucleic acid sequences
  • the sequencing and reconstruction of long nucleic acid sequences is based on the shotgun principle.
  • the sequence of a long piece of DNA is determined by sequencing small fragments (NSKFs) and a subsequent reconstruction.
  • a uniform primer binding site (PBS) is coupled to the 3 'end of the NSKFs and a uniform primer binds to this PBS.
  • PBS uniform primer binding site
  • a double-stranded oligonucleotide complex (3a) which has, for example, a modification on both strands (3b), is located on the double-stranded NSKFs (3c).
  • NSKFs double-stranded NSKFs with uniform PBS (3d) are created.
  • PBS uniform primer binding site
  • NTs are coupled to the 3 'end of the single-strand NSKFs (a so-called "tailing").
  • a uniform NT By using a uniform NT, a uniform PBS is created.
  • a gel layer (2) adheres to a solid base (1), e.g. a polyacrylamide gel (Fig. 5a), or many gel beads (5), e.g. Agarose beads (Fig. 5b).
  • NSKFs (4) are bound to the surface of the gel.
  • the NSKFs have a functional group, e.g. Biotin, and are bound to the gel via streptavidin or avidin (3).
  • a gel-like reaction surface (1) is attached to a solid base (2) which is permeable to the excitation and fluorescent light. Together they form the lid of the flow cell.
  • the liquids in the flow cell can be exchanged in a controlled manner, the flow cell forming a flow device together with the reservoir (3), pump (4) and valve (5).
  • NSKF primer complexes are bound to the reaction surface (not shown here).
  • the signals of the installed NT * s are detected with the detection apparatus (6).
  • the analysis is based on the sequencing of short sections of mRNA.
  • mRNA - the mRNA population to be analyzed in this example consisting of two different mRNA molecule populations (thin and thick strips represent mRNA molecules)
  • a wide-field optical detection system is shown. After installing marked NT * s, the surface (7) scanned, the fluorescence signals being detected by individual dye molecules coupled to the NTs.
  • Fig. 8a Schematic representation of a portion of the reaction surface (gray) that is scanned.
  • the circles each correspond to the recording of a 2D image and represent the areas from which the fluorescence signals are detected.
  • Several signals (for example 100 to 10,000) of individual molecules are registered simultaneously per exposure.
  • the reaction surface is scanned in each cycle, several images being taken from different locations on the surface during the scanning process. Up to several million signals can be recorded by built-in NT * s.
  • the high degree of parallelism is the basis for the speed of the process.
  • Fig. 8b A recording (a 2D image) with signals from individual, built-in NT * s.
  • Fig. 8c detail from Figure 8b.
  • the section shows signals from four built-in NTs. Each signal has characteristic properties of the single molecule signals (see description) and can be identified on the basis of these (preferably with the aid of a computer program). The corresponding X, Y coordinates are assigned to each of the identified signals.

Abstract

The invention relates to a method for analyzing nucleic acid sequences and gene expression. The method is based on the detection of fluorescence signals of nucleotide molecules inserted into growing nucleic acid chains by means of a polymerase. The reaction occurs on a plane surface, wherein a plurality of individual nucleic acid molecules are immobilized on said surface. All said nucleic acid molecules are exposed to the same conditions so that a build-up reaction can simultaneously take place in all nucleic acid molecules.

Description

Verfahren zur Analyse von Nukleinsäurekettensequenzen und der GenexpressionMethod for the analysis of nucleic acid chain sequences and gene expression
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten und der Genexpression. Die Grundlage der Methode ist die Detektion von Fluoreszenzsignalen einzelner mit Farbstoffen markierter Nukleotidmoleküle, die durch eine Polymerase in eine wachsende Nukleinsäurekette eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. An diese Oberfläche sind viele einzelne Nukleinsäure-Moleküle gebunden. Alle diese Nukleinsäure-Moleküle sind gleichen Bedingungen ausgesetzt, so dass an allen Nukleinsäure- Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.The invention relates to a method for analyzing nucleic acid chains and gene expression. The basis of the method is the detection of fluorescence signals of individual nucleotide molecules labeled with dyes, which are incorporated into a growing nucleic acid chain by a polymerase. The reaction takes place on a flat surface. Many individual nucleic acid molecules are bound to this surface. All of these nucleic acid molecules are exposed to the same conditions, so that a build-up reaction can take place simultaneously on all nucleic acid molecules.
Das Verfahren umfaßt im wesentlichen folgende Schritte:The process essentially comprises the following steps:
1) Bindung der Nukleinsäurekettenfragmenten (NSKFs) auf einer planen Oberfläche mit anschließender Hybridisierung von Primern, alternativ Bindung von Primern mit anschließender Hybridisierung von NSKFs, so dass NSKF-Primer-Komplexe gebildet werden.1) Binding of the nucleic acid chain fragments (NSKFs) on a flat surface with subsequent hybridization of primers, alternatively binding of primers with subsequent hybridization of NSKFs, so that NSKF-primer complexes are formed.
2) Durchführen einer zyklischen Aufbaureaktion, wobei jeder Zyklus aus folgenden Schritten besteht : a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu den gebundenen NSKF-Primer- Komplexen, b) Inkubation der gebundenen NSKF-Primer-Komplexe mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen, d) Detektion der Signale von einzelnen Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f ) Waschen .2) Carrying out a cyclic build-up reaction, each cycle consisting of the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to the bound NSKF-primer complexes, b) incubating the bound NSKF-primer complexes with them Solution under conditions suitable for extending the complementary strands by one NT, c) washing, d) detection of signals from individual molecules, e) removal of the label from the built-in nucleotides, f) washing.
Gegebenenfalls erfolgen mehrfache Wiederholungen des Zyklus .If necessary, the cycle is repeated several times.
3 ) Analyse der detektierten Signale der einzelnen Moleküle .3) Analysis of the detected signals of the individual molecules.
4 ) Rekonstruktion der Sequenzen aus den Einzeldaten . 1. Abkürzungen und Begriffserläuterungen4) Reconstruction of the sequences from the individual data. 1. Abbreviations and explanations of terms
DNA - Desoxyribonukleinsäure verschiedenen Ursprungs und unterschiedlicher Länge (genomische DNA, cDNA, ssDNA, dsDNA)DNA - deoxyribonucleic acid of different origins and different lengths (genomic DNA, cDNA, ssDNA, dsDNA)
RNA - Ribonukleinsäure (meist mRNA)RNA - ribonucleic acid (mostly mRNA)
Polymerasen - Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können ( z.B. DNA- Polymerasen, Reverse-Transkriptasen, RNA-Polymerasen)Polymerases - enzymes that can incorporate complementary nucleotides into a growing DNA or RNA strand (e.g. DNA polymerases, reverse transcriptases, RNA polymerases)
dNTP - 2 ' -deoxi-Nucleosid-Triphosphate, Substrate für DNA- Polymerasen und Reverse-TranskriptasendNTP - 2 'deoxy nucleoside triphosphates, substrates for DNA polymerases and reverse transcriptases
NTP - Nukleosid-Triphosphate, Substrate für RNA-PolymerasenNTP - nucleoside triphosphates, substrates for RNA polymerases
NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.NT - natural nucleotide, usually dNTP, unless expressly stated otherwise.
Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäuresequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" für Nukleosid-Monophosphate .Abbreviation "NT" is also used when specifying the length of a nucleic acid sequence, e.g. NT 1,000. In this case "NT" stands for nucleoside monophosphates.
Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des Suffixes "s" gebildet, »NTM steht zum Beispiel für "Nukleotid", "NTs" steht für mehrere Nukleotide.The majority of abbreviations in the text are formed by using the suffix "s", » NT M stands for" nucleotide "," NTs "stands for several nucleotides.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet. NTs* bedeutet: modifizierte NukleotideNT * - modified nucleotide, usually dNTP, unless expressly stated otherwise. NTs * means: modified nucleotides
NSK - Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen LängeNSK - nucleic acid chain. DNA or RNA in their original length
NSKF - Nukleinsäurekettenfragment (DNA oder RNA) , das einem Teil der Gesamtsequenz entspricht, NSKFs Nukleinsäurekettenfragmente . Die Summe der NSKFs bildet ein Äquivalent zur Gesamtsequenz . Die NSKFs können beispielsweise Fragmente von DNA- oder RNA-Gesamtsequenz sein, die nach einem Fragmentierungsschritt entstehen.NSKF - Nucleic acid chain fragment (DNA or RNA) that corresponds to part of the total sequence, NSKFs Nucleic acid chain fragments. The sum of the NSKFs is equivalent to the overall sequence. The NSKFs can, for example, be fragments of the entire DNA or RNA sequence that arise after a fragmentation step.
55
Gesamtsequenz - die in der Sequenzierungsreaktion eingesetzte Sequenz oder die eingesetzten Sequenzen, meistens in NSKFs überführt. Sie kann ursprünglich aus einer oder mehreren NSKs bestehen. Dabei kann die Gesamtsequenz Teile oder ÄquivalenteTotal sequence - the sequence or sequences used in the sequencing reaction, mostly converted into NSKFs. It can originally consist of one or more NSKs. The total sequence can be parts or equivalents
0 einer anderen Sequenz oder von Sequenz-Populationen darstellen (z.B. mRNA, cDNA, Plasmid-DNA mit Insert, BAC, YAC) und aus einer oder unterschiedlichen Spezies stammen.Represent 0 of another sequence or of sequence populations (e.g. mRNA, cDNA, plasmid DNA with insert, BAC, YAC) and originate from one or different species.
Primerbindungstelle (PBS) - Teil der Sequenz in der NSK oder 5 NSKF, an den der Primer bindet.Primer binding site (PBS) - part of the sequence in the NSK or 5 NSKF to which the primer binds.
Referenzsequenz - eine bereits bekannte Sequenz, zu der die Abweichungen in der zu untersuchenden Sequenz bzw. in den zu untersuchenden Sequenzen (Gesamtsequenz) ermittelt werden. D Als Referenzsequenzen können in Datenbanken zugängliche Sequenzen verwendet werden, wie z.B. aus der NCBI-Datenbank.Reference sequence - a sequence already known, to which the deviations in the sequence to be examined or in the sequences to be examined (overall sequence) are determined. D Sequences accessible in databases can be used as reference sequences, e.g. from the NCBI database.
Tm - SchmelztemperaturTm - melting temperature
5 Plane Oberfläche - Oberfläche, die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition gleichzeitig zu detektieren. 2) Die5 Plane surface - surface which preferably has the following features: 1) It allows several individual molecules, preferably more than 100, more preferably more than 1000, to be detected simultaneously with the given objective-surface distance at one objective position. 2) The
D immobilisierten einzelnen Moleküle befinden sich in derselben Fokusebene, die reproduzierbar eingestellt werden kann.The immobilized individual molecules are in the same focal plane, which can be set reproducibly.
Weitfeld-Optik-Detektionssystem - Detektionssystem, das gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 5 Fläche verteilten Molekülen detektieren kann, wobei die Fläche ca. 100 μm2 und größer ist. Ein Beispiel für Weitfeld- Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder Axioplan 2e (Zeiss) mit einem Planneofluar-Objektiv lOOx NA 1.4 Ölim ersion (Zeiss), oder einem Planapochromat-Objektiv lOOx NA 1.4 Ölimmersion (Zeiss); die Anregung der Fluoreszenz kann dabei mit einer Lampe, z.B. Quecksilberdampflampe, oder einem Laser oder Dioden erfolgen. Sowohl Epifluoreszenzmdus als auch im Totalreflexions-Fluoreszenzmikroskopie-Modus (total internal reflection fluorescence microscopy, TIRF- Microscopy) oder Laser-Scanning-Mikroskopie-Modus können verwendet werden. In dieser Anmeldung wird Gebrauch von dieser Weitfeld-Detektionsoptik gemachtWide-field optical detection system - detection system that can simultaneously detect fluorescence signals from individual molecules distributed over a surface, the surface being approximately 100 μm 2 and larger. An example of wide-field detection optics is provided by the Axiovert 200 or fluorescence microscope Axioplan 2e (Zeiss) with a planofluar objective lOOx NA 1.4 oil immersion (Zeiss), or a planapochromatic objective lOOx NA 1.4 oil immersion (Zeiss); The fluorescence can be excited using a lamp, for example a mercury vapor lamp, or a laser or diode. Both epifluorescence mode and total internal reflection fluorescence microscopy (TIRF microscopy) mode or laser scanning microscopy mode can be used. This wide field detection optics is used in this application
Definition der Termination: Als Termination wird in dieser Anmeldung der reversible Stop des Einbaus der modifizierten ungespalteten NTs* bezeichnet .Definition of termination: In this application, termination is the reversible stop in the installation of the modified, uncleaved NTs * .
Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termination" durch Dideoxy-NTP bei einer konventionellen Sequenzierung zu trennen.This term is to be separated from the usual use of the word "termination" by dideoxy-NTP in conventional sequencing.
Die Termination kommt nach dem Einbau eines modifizierten NT* zustande. Ein zur Termination führender Substituent- bzw. eine Modifikation der 3 "-OH-Position an der Desoxyribose eines Nukleotides, die zur Termination führt. Der Substituent kann unter milden Bedingungen abgespalten werden, so daß 3"- OH Funktion wieder für den Einbau eines NT* zur Verfügung steht. An diesen Substituenten ist ein Fluoreszenzfarbstoff gekoppelt .The termination comes after the installation of a modified NT * . A substituent leading to the termination or a modification of the 3 "-OH position on the deoxyribose of a nucleotide, which leads to the termination. The substituent can be split off under mild conditions, so that the 3" - OH function again for the incorporation of an NT * is available. A fluorescent dye is coupled to these substituents.
Genprodukte - Bei den Genprodukten handelt es sich um die primären Genprodukte der Gene . Im wesentlichen handelt es sich dabei um RNA-Transkripte der genannten Gene, welche auch als Target-Sequenzen (oder Target-Nukleinsäuresequenzen) bezeichnet werden. Diese Target-Sequenzen schließen neben mRNA auch davon abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA abgeleitete RNA oder von cDNA a plifizierte DNA ein.Gene products - The gene products are the primary gene products of the genes. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to mRNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
Einzelnukleotidpoly orphismen (single nucleotide polymorphisms, SNPs) - Veränderungen in den Sequenzen, die als Substitution (Transition oder Transversion) oder als Deletion oder Insertion einzelner NT auftreten können.Single nucleotide poly orphisms (single nucleotide polymorphisms, SNPs) - changes in the sequences that can occur as a substitution (transition or transversion) or as a deletion or insertion of individual NT.
2. Stand der Technik2. State of the art
Die Nukleinsäurenketten-Sequenzanalyse undNucleic acid chain sequence analysis and
Genexpressionsanalyse sind in vielen Bereichen der Wissenschaft, Medizin und Industrie zu einem wichtigen Werkzeug geworden. Zur Analyse wurden mehrere Verfahren entwickelt .Gene expression analysis has become an important tool in many areas of science, medicine and industry. Several methods have been developed for analysis.
Die bekanntesten Verfahren sind die Ketten--Terminations- Sequenzierung nach Sanger (F. Sanger et al . PNAS 1977 v.74 s. 5463) , die auf dem Einbau von Kettenterminatoren basiert, und die Maxam-Gilbert-Methode, die auf Basen-spezifischer Modifikation und Spaltung von Nukleinsäureketten beruht (A.M. Maxam and W. Gilbert PNAS 1977, v.74 S.560). Beide Methoden liefern eine Anzahl von Nukleinsäurekettenfragmenten verschiedener Längen. Diese Fragmente werden der Länge nach in einem Gel aufgetrennt. Dabei müssen alle Nachteile der Elektrophorese (wie z.B. lange Laufzeit, relativ kurze Strecken von Sequenzen, die in einem Ansatz bestimmt werden können, begrenzte Anzahl der parallelen Ansätze sowie relativ große Mengen an DNA) in Kauf genommen werden. Diese Methoden sind sehr arbeitsintensiv und langsam.The best known methods are chain termination sequencing according to Sanger (F. Sanger et al. PNAS 1977 v.74 p. 5463), which is based on the installation of chain terminators, and the Maxam-Gilbert method, which is based on bases specific modification and cleavage of nucleic acid chains is based (AM Maxam and W. Gilbert PNAS 1977, v.74 p.560). Both methods deliver a number of nucleic acid chain fragments of different lengths. These fragments are separated lengthwise in a gel. All disadvantages of electrophoresis (such as long running times, relatively short stretches of sequences that can be determined in one approach, limited number of parallel approaches and relatively large amounts of DNA) have to be accepted. These methods are very labor intensive and slow.
Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybridisierung von Nukleinsäureketten mit kurzen Oligonukleotiden. Dabei wird mit mathematischen Methoden berechnet, wie viele Oligonukleotide einer bestimmten Länge vorhanden sein müssen, um eine komplette Sequenz zu ermitteln (Z.T. Strezoska et al . PNAS 1991 v.88 S.10089, R.S.Drmanac et al. Science 1993 v.260 S.1649). Auch dieses Verfahren ist mit Problemen behaftet : Es kann nur eine Sequenz in einem Ansatz bestimmt werden, sekundäre Strukturen stören die Hybridisierung und Sequenzwiederholungen verhindern die korrekte Analyse .Another sequencing method is based on the hybridization of nucleic acid chains with short oligonucleotides. Mathematical methods are used to calculate how many oligonucleotides of a certain length are required to determine a complete sequence (ZT Strezoska et al. PNAS 1991 v.88 p.10089, RSDrmanac et al. Science 1993 v.260 p.1649 ). This method also has problems: only one sequence can be determined in one approach, secondary structures disrupt it Hybridization and repeats prevent correct analysis.
Eine andere Möglichkeit zur Sequenzierung haben Arbeitsgruppen beispielsweise von (Dower US Patent 5.547.839, Canard et al . US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v.18 S.1021, Metzker et al . NAR 1994, v.22, S.4259, Welch et al . Nucleosides & Nucleotides 1999, v.18, S.197) entwickelt. Diese Methode wird abgekürzt als BASS (Base Addition Sequencing Scheme) oder SBS (Sequecing by Synthesis) bezeichnet. Dabei wird eine große Anzahl gleicher einzel- strängiger DNA-Stücke an einem definierten Ort auf einer Oberfläche fixiert und das Signal von der Gesamtheit dieser vielen identischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine Lösung mit Polymerase und Nukleotiden zugegeben, so dass ein komplementärer Strang synthetisiert werden kann. Dabei soll die Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut . Dieses wird detektiert, worauf die Polymerase in einem nächsten Zyklus das nächste Nukleotid einbaut.Working groups have another possibility for sequencing, for example, of (Dower US Patent 5,547,839, Canard et al. US Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v.18 p.1021, Metzker et al. NAR 1994, v.22 , P.4259, Welch et al. Nucleosides & Nucleotides 1999, v.18, p.197). This method is abbreviated as BASS (Base Addition Sequencing Scheme) or SBS (Sequecing by Synthesis). A large number of identical single-stranded DNA pieces are fixed at a defined location on a surface and the signal from all of these many identical DNA pieces is analyzed. A solution with polymerase and nucleotides is added to this fixed DNA so that a complementary strand can be synthesized. The polymerase should work step by step: only one nucleotide is incorporated in each step. This is detected, whereupon the polymerase incorporates the next nucleotide in a next cycle.
Trotz des Gelingens einiger einzelner Schritte der Methode wurde sie nicht zu einem funktionsfähigen Verfahren entwickelt . Dies kann beispielsweise auf folgenden Tatsachen beruhen: Beim Aufbau der komplementären Stränge tritt sehr schnell eine Desynchronisation der Synthese auf, so dass bei jedem Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente sequenziert werden. Es ist zu betonen, dass alle beschriebenen BASS-Methoden nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird stattdessen von einer großen Anzahl identischer an einem definierten Ort immobilisierter Moleküle registriert. Die in diesen Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und "Moleküle" zielt dabei nicht auf individuelle, voneinander getrennte Moleküle, sondern auf eine Population, die aus vielen identischen Molekülen besteht . Identisch heißt in diesem Fall, dass die Moleküle die gleiche Sequenz haben. Die Analyse des Genexpressions-Spektrums ist zu einem wichtigen Werkzeug in der Wissenschaft geworden. Der Vergleich der Genexpressions-Spektren zwischen verschiedenen Zelllinien, Geweben oder Entwicklungsstadien erlaubt Rückschlüsse auf die darin ablaufenden spezifischen biologischen Prozesse. So kann man z.B. erwarten, dass der Vergleich zwischen Tumorzellen und gesunden Zellen gleicher Herkunft Auskunft über die am Tumorgeschehen beteiligten Gene gibt. Dabei ist wichtig, dass die Aktivität möglichst vieler oder aller Gene gleichzeitig analysiert wird.Despite the success of some of the method's individual steps, it has not been developed into a functional process. This can be based, for example, on the following facts: When the complementary strands are built up, the synthesis is desynchronized very quickly, so that the errors accumulate with each step. Therefore only very short fragments can be sequenced. It should be emphasized that all BASS methods described are not based on the detection of individual molecules. Instead, the signal is registered by a large number of identical molecules immobilized at a defined location. The customary use of the terms “individual molecules” and “molecules” in these methods does not aim at individual, separate molecules, but at a population consisting of many identical molecules. In this case, identical means that the molecules have the same sequence. Analysis of the gene expression spectrum has become an important tool in science. The comparison of the gene expression spectra between different cell lines, tissues or developmental stages allows conclusions to be drawn about the specific biological processes taking place in them. For example, one can expect that the comparison between tumor cells and healthy cells of the same origin will provide information about the genes involved in the tumor process. It is important that the activity of as many or all genes as possible is analyzed at the same time.
Die Analyse der Genexpression ist eine komplexe Aufgabe: Die Anzahl der in einem Zelltyp aktiven Gene kann mehrere Tausend betragen. Die Analyse sollte aber möglichst alle im Genom der betreffenden Art enthaltenen Gene (etwa 32000 beim Menschen) berücksichtigen. Hinzu kommt, dass die im jeweiligen Zelltyp aktiven Gene erstens meist noch nicht komplett bekannt sind und zweitens unterschiedlich stark exprimiert werden.The analysis of gene expression is a complex task: the number of genes active in a cell type can be several thousand. However, the analysis should consider all genes contained in the genome of the species in question (approximately 32,000 in humans). In addition, the genes active in the respective cell type are first of all mostly not yet completely known and secondly they are expressed to different extents.
Es wurden bereits viele Methoden zur Genexpressionsanalyse entwickelt, so z.B. Differential Display (Nature 1984, v.308 S.149, Science 1992 v.257 S.967), Expressed Sequence Tags (EST) (Science 1991 v.252, S.1656, Nature Genetics 1992, v.2 S.173), Northern blotting oder RT-PCR (PNAS 1977, v.74, S.5350, Cell 1983 v.34 S.865, "The PCR Technique, RT-PCR" 1998, Ed. Paul Suebert, Eaton Publishing) . Alle diese Methoden können nur eine sehr begrenzte Anzahl an Genen pro Reaktion analysieren und sind zum Teil sehr arbeitsintensiv.Many methods for gene expression analysis have already been developed, e.g. Differential Display (Nature 1984, v.308 p.149, Science 1992 v.257 p.967), Expressed Sequence Tags (EST) (Science 1991 v.252, p.1656, Nature Genetics 1992, v.2 p.173 ), Northern blotting or RT-PCR (PNAS 1977, v.74, p.5350, Cell 1983 v.34 p.865, "The PCR Technique, RT-PCR" 1998, Ed. Paul Suebert, Eaton Publishing). All of these methods can only analyze a very limited number of genes per reaction and are sometimes very labor-intensive.
Die am weitesten verbreitete Methode zur parallelen Analyse der Genexpressionsmuster ist die Hybridisierung eines zu analysierenden Gemischs von cDNA-Molekülen mit an eine Oberfläche gebundenen Oligonukleotiden, die in einer bestimmten Anordnung, meist als "Microarray" fixiert sind ("Microarray Biochip Technology" 2000, Ed. M.Schena, Eaton Publishing, Zhao et al. Gene 1995, v. 156, S.207, Schena et al. Science 1995 v.270, S.467, Lockhart et al - US Patent 6.040.138, Wang US Patent 6.004.755, Arlinghaus et al . US Patent 5.821.060, Southern US Patent 5.700.637, Fodor et al . US Patent 5.871.928) .The most widespread method for parallel analysis of the gene expression patterns is the hybridization of a mixture of cDNA molecules to be analyzed with oligonucleotides bound to a surface, which are fixed in a certain arrangement, usually as a "microarray"("Microarray Biochip Technology" 2000, Ed M.Schena, Eaton Publishing, Zhao et al. Gene 1995, v. 156, p.207, Schena et al. Science 1995 v.270, p.467, Lockhart et al - US Patent 6,040,138, Wang U.S. Patent 6,004,755, Arlinghaus et al. U.S. Patent 5,821,060, Southern U.S. Patent 5,700,637, Fodor et al. U.S. Patent 5,871,928).
Zu den großen Nachteilen der Hybridisierungsmethode zählen: Die Fertigung der an die Oberfläche gebundenen Oligonukleotide ist teuer. Die Analyse beschränkt sich auf Gene, deren Sequenzen bereits bekannt sind. Mehrere Mismatch-Kontrollen vergrößern die Anzahl der Oligonukleotide, die immobilisiert werden müssen.The major disadvantages of the hybridization method include: The production of the oligonucleotides bound to the surface is expensive. The analysis is limited to genes whose sequences are already known. Multiple mismatch controls increase the number of oligonucleotides that need to be immobilized.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren zur Sequenzanalyse von Nukleinsäureketten und der Analyse der Genexpression bereitzustellen, das die Nachteile der oben erwähnten Methoden nicht aufweist und vor allem eine billigere, schnellere und effizientere Analyse von Nukleinsäuresequenzen ermöglicht . Insbesondere soll das Verfahren in der Lage sein, viele Sequenzen parallel zu bestimmen. Es kann dann beispielsweise für die Analyse sehr langer Nukleinsäureketten (mehrere Mb) oder für die Variantenalyse an vielen kurzen Ketten (Mutationsanalyse, SNP- Analyse) in einem Ansatz verwendet werden.The object of the present invention is therefore to provide a method for the sequence analysis of nucleic acid chains and the analysis of gene expression which does not have the disadvantages of the above-mentioned methods and, above all, enables a cheaper, faster and more efficient analysis of nucleic acid sequences. In particular, the method should be able to determine many sequences in parallel. It can then be used, for example, for the analysis of very long nucleic acid chains (several Mb) or for variant analysis on many short chains (mutation analysis, SNP analysis) in one approach.
3. Kurze Beschreibung3. Brief description
Gegenstand der vorliegenden Erfindung ist ein Verfahren zur parallelen Sequenzanalyse von Nukleinsäuresequenzen (Nukleinsäureketten, NSKs) gelöst, bei dem manThe present invention relates to a method for parallel sequence analysis of nucleic acid sequences (nucleic acid chains, NSKs), in which
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, manFragments (NSKFs) of single-stranded NSKs with a length of about 50 to 1000 nucleotides are generated, which represent overlapping partial sequences of the total sequences
die NSKFs unter Verwendung eines einheitlichen oder mehrerer unterschiedlicher Primer in Form von NSKF-Primer- Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, man eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung einer oder mehrerer Polymerasen durchführt, indem manthe NSKFs are bound on a reaction surface in a random arrangement using one or more different primers in the form of NSKF-primer complexes cyclically build the complementary strand of the NSKFs using one or more polymerases by:
a) zu den an die Oberfläche gebundenen NSKF-Primer- Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent mit dem Fluoreszenzfarbstoff abspaltbar ist, mana) a solution is added to the NSKF primer complexes bound to the surface, which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * Fluorescent dyes located on the NTs * are selected such that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * being structurally modified such that the polymerase does not form after incorporating such an NT * into a growing complementary strand is able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detek- tiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktions- oberflache bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal which is characteristic of the respective fluorescent dye, the relative position at the same time of the individual fluorescence signals on the reaction surface is determined
e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur Termination führenden Substituenten und die Fluoreszenzfarbstoffe von den am komplementären Strang angefügten NTs* abspaltet, mane) to generate unlabeled (NTs or) NSKFs, the substituents leading to the termination and the fluorescent dyes are cleaved off from the NTs * attached to the complementary strand, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner NSKF-Primer-Komplexe auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt.the relative position of individual NSKF-primer complexes on the reaction surface and the sequence of these NSKFs being determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs.
Aus den ermittelten Teilsequenzen kann man beispielsweie die Gesamtsequenz der NSKs bestimmen. Unter einer parallelen Sequenzanalyse wird in diesem Zusammenhang die gleichzeitige Sequenzanalyse vieler NSKFs verstanden (beispielsweise 1.000.000 bis 10.000.000), wobei diese NSKFs von einer einheitlichen NSK-Population oder von mehreren unterschiedlichen NSK-Populationen abgeleitet sind.The overall sequence of the NSKs can be determined, for example, from the partial sequences determined. In this context, a parallel sequence analysis is understood to mean the simultaneous sequence analysis of many NSKFs (for example 1,000,000 to 10,000,000), these NSKFs being derived from a uniform NSK population or from several different NSK populations.
Die erhaltene Population von überlappenden Teilsequenzen läßt sich beispielsweise bei de novo Sequenzierung mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen (Huang et al. Genom Res . 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J . Comput . Biol . 1994 v.l S.257) .The resulting population of overlapping partial sequences can be combined, for example, in de novo sequencing with commercially available programs to form the overall sequence of the NSK (Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257).
Bei der Analyse von Varianten einer bekannten Referenzsequenz lassen sich Mutationen oder Einzelnukleotidpolymorphismen durch einen Vergleich der erhaltenen überlappenden Teilsequenzen mit der Referenzsequenz feststellen.When analyzing variants of a known reference sequence, mutations or single nucleotide polymorphisms can be identified by comparing the obtained overlapping partial sequences with the reference sequence.
Gemäß einer besonderen Ausführungsform der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei manAccording to a particular embodiment of the invention, the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
a) in jedem Zyklus nur jeweils ein markiertes NT*, b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs* a) only one marked NT * in each cycle, b) two differently marked NTs * in each cycle or c) four differently marked NTs * in each cycle
einsetzt .starts.
Wenn die NSKs Varianten einer bekannten Referenzsequenz sind kann das Verfahren auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz ermittelt.If the NSKs are variants of a known reference sequence, the method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently marked NTs * and two unmarked NTs in the cycles and one Total sequences determined by comparison with the reference sequence.
Gegenstand der vorliegenden Erfindung ist ferner ein Verfahren zur hoch parallelen Analyse der Genexpression, bei dem manThe present invention also relates to a method for highly parallel analysis of gene expression, in which
einzelsträngige Genprodukte bereitstellt, manprovides single-stranded gene products, one
die Genprodukte unter Verwendung eines einheitlichen oder mehrerer unterschiedlichen Primer in Form von Genprodukt- Primer-Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, manthe gene products are bound on a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes, one
eine zyklische Aufbaureaktion des komplementären Stranges der Genprodukte unter Verwendung einer oder mehrerer Polymerasen durchführt, indem man a) zu den auf der Oberfläche gebundenen Genprodukt- Primer-Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell' so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent mit dem Fluoreszenzfarbstoff abspaltbar ist, manperform a cyclic assembly reaction of the complementary strand of the gene products using one or more polymerases by a) a solution is added to the gene product-primer complexes bound to the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * each * located at the NTs fluorescent dyes are selected so located that can differ from each other, the NTs used * by measuring different fluorescent signals, the NTs * are structurally modified 'so that the polymerase after incorporation of such NT * not in a growing complementary strand is able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye, man
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detek- tiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur Termination führenden Substituenten mit den Fluoreszenzfarbstoffen von den am komplementären Strang angefügten NTs* abspaltet, mane) for the generation of unlabelled (NTs or) NSKFs, the substituents leading to the termination with the Splits off fluorescent dyes from the NTs * attached to the complementary strand, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner Genprodukt- Primer-Komplexe auf der Reaktionsoberfläche und die Sequenz dieser Genprodukte durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten Teilsequenzen die Identität der Genprodukte bestimmt.whereby the relative position of individual gene product-primer complexes on the reaction surface and the sequence of these gene products are determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs and the identity of the gene products is determined from the partial sequences determined certainly.
Bei den Genprodukten handelt es sich um die primären Genprodukte der Gene, deren Expression analysiert werden soll. Im wesentlichen handelt es sich dabei um RNA-Transkripte der genannten Gene, welche auch als Target-Sequenzen (oder Target- Nukleinsäuresequenzen) bezeichnet werden. Diese Target- Sequenzen schließen neben RNA auch davon abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA ein.The gene products are the primary gene products of the genes whose expression is to be analyzed. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to RNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
Die Genprodukte oder Target-Sequenzen können entweder als mRNAs direkt aus einer biologischen Probe (z.B. Zellextrakt, Gewebeextrakt oder Extrakt von ganzen Organismen) isoliert oder als cDNAs durch reverse Transkription der mRNAs erhalten werden.The gene products or target sequences can either be isolated as mRNAs directly from a biological sample (e.g. cell extract, tissue extract or extract from whole organisms) or obtained as cDNAs by reverse transcription of the mRNAs.
Unter einer hoch parallelen Analyse wird in diesem Zusammenhang die gleichzeitige Sequenzanalyse vieler Genprodukt-Moleküle verstanden (beispielsweise 1.000.000 bis 10.000.000), wobei diese Genprodukt-Moleküle eine komplexe heterogene Population darstellen, die z.B. einem kompletten Expressionsprofil bzw. einem Expressionsspektrum eines Gewebes entspricht .In this context, a highly parallel analysis is understood to mean the simultaneous sequence analysis of many gene product molecules (for example 1,000,000 to 10,000,000), these gene product molecules being a complex one represent a heterogeneous population that corresponds, for example, to a complete expression profile or an expression spectrum of a tissue.
Gemäß einer besonderen Ausführungsform der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei manAccording to a particular embodiment of the invention, the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
a) in jedem Zyklus nur jeweils ein markiertes NT*, b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs* a) only one marked NT * in each cycle, b) two differently marked NTs * in each cycle or c) four differently marked NTs * in each cycle
einsetzt .starts.
Das Verfahren kann auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Identität der Genprodukte durch Vergleich mit den Referenzsequenzen ermittelt .The method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and comparing the identity of the gene products with the reference sequences determined.
Gegenstand der Erfindung ist ferner ein Kit zur Durchführung des Verfahrens das eine Reaktionsoberfläche, zur Durchführung des Verfahrens erforderliche Reaktionslösungen, eine oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die NTs* an der 3 ' -Position strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent mit dem Fluoreszenzfarbstoff abspaltbar ist. Gemäß einer besonderen Ausführungsform der Erfindung enthält das Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, einzelsträngige Nukleinsäuremoleküle, die als PBS in die NSKFs eingeführt werden, Oligonukleotid-Primer, zur Abspaltung der Fluoreszenzfarbstoffe und der zur Termination führenden Substituenten erforderliche Reagenzien und/oder Waschlösungen.The invention further relates to a kit for carrying out the method which contains a reaction surface, reaction solutions required for carrying out the method, one or more polymerases, and nucleotides (NTs), one to four of which are labeled with fluorescent dyes, the NTs * on the 3 'position are structurally modified so that after installing such an NT * in a growing complementary strand, the polymerase is not able to incorporate another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye. According to a particular embodiment of the invention, the kit also contains for the production of Single strands of double strands required reagents, single stranded nucleic acid molecules, which are introduced as PBS in the NSKFs, oligonucleotide primers, for cleaving off the fluorescent dyes and the reagents and / or washing solutions leading to termination.
Die erfindungsgemäße Methode dient zur Ermittlung der Nukleinsäuresequenzen und kann in verschiedenen Bereichen der Genetik eingesetzt werden. Dazu zählen insbesondere die Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz-Polymorphismen und Punktmutationen sowie die parallele Analyse einer großen Zahl an Gensequenzen, sowie die Analyse der Genexpression.The method according to the invention is used to determine the nucleic acid sequences and can be used in various areas of genetics. This includes in particular the determination of unknown, long sequences, analysis of sequence polymorphisms and point mutations as well as the parallel analysis of a large number of gene sequences and the analysis of gene expression.
Bei der Analyse langer Nukleinsäureketten (z.B. 100 Kb und länger) hängt die Vorbereitung des zu analysierenden Materials (einzel- und doppelsträngige Nukleinsäuresequenzen) von der Aufgabestellung ab und hat das Ziel, aus einer langen Nukleinsäurekette eine Population an relativ kleinen, einzelsträngigen Nukleinsäurekettenfragmenten (NSKFs) zu bilden, diese Fragmente mit einem für den Start der Sequenzierungsreaktion geeigneten Primer zu versehen (NSKF- Primer-Komplexe) und auf einer planen Oberfläche zu fixieren.When analyzing long nucleic acid chains (e.g. 100 Kb and longer), the preparation of the material to be analyzed (single and double-stranded nucleic acid sequences) depends on the task at hand and the aim is to create a population of relatively small, single-stranded nucleic acid chain fragments (NSKFs) from a long nucleic acid chain. to form, to provide these fragments with a primer suitable for starting the sequencing reaction (NSKF-primer complexes) and to fix them on a flat surface.
Dabei werden einzelne NSKFs auf einer planen Oberfläche in einer solchen Weise fixiert, dass eine enzymatische Reaktion an diesen Molekülen ablaufen kann. Prinzipiell sind verschiedene Arten der Immobilisation möglich, die von der Zielsetzung, der Art der NSK und der für die Reaktion eingesetzten Polymerase abhängen. Die NSKFs werden bei der Immobilisierung bzw. Bindung zufällig auf der Oberfläche verteilt, d.h. es muß also nicht auf eine exakte Positionierung der einzelnen Ketten geachtet werden. NSKF- Primer-Komplexe können über die NSKFs oder Primer an die Oberfläche gebunden werden. Die NSKF-Primer-Komplexe müssen dabei in einer solchen Dichte auf der Oberfläche fixiert werden, dass eine eindeutige Zuordnung der später detektierten Signale von den eingebauten NT*s zu einzelnen NSKFs gewährleistet ist.Individual NSKFs are fixed on a flat surface in such a way that an enzymatic reaction can take place on these molecules. In principle, different types of immobilization are possible, which depend on the objective, the type of NSK and the polymerase used for the reaction. The NSKFs are randomly distributed on the surface during immobilization or binding, that is, it is not necessary to ensure that the individual chains are positioned exactly. NSKF primer complexes can be bound to the surface via the NSKFs or primers. The NSKF primer complexes must be fixed to the surface in such a density ensure that the later-detected signals are clearly assigned by the installed NT * s to individual NSKFs.
Nach der Vorbereitung der NSKFs startet man mit allen auf der Oberfläche immobilisierten NSKF-Primer-Komplex-Molekülen die Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient die Synthese des komplementären Stranges zu jedem einzelnen gebundenen NSKF. Dabei werden in den neu synthetisierten Strang markierte NTs* eingebaut . Die Polymerase baut in einem Zyklus nur ein einziges markiertes NT* in die wachsende Kette ein.After the preparation of the NSKFs, the sequencing reaction is started with all NSKF primer complex molecules immobilized on the surface. The sequencing is based on the synthesis of the complementary strand to each individual bound NSKF. Labeled NTs * are installed in the newly synthesized strand. The polymerase incorporates only one labeled NT * into the growing chain in one cycle.
Die Sequenzierungsreaktion verläuft in mehreren Zyklen. Ein Zyklus umfasst folgende Schritte :The sequencing reaction proceeds in several cycles. A cycle comprises the following steps:
a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu den gebundenen NSKF-Primer-Komplexen, b) Inkubation der gebundenen NSKF-Primer-Komplexe mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen, d) Detektion der Signale von einzelnen Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f ) Waschen .a) adding a solution with labeled nucleotides (NTs * ) and polymerase to the bound NSKF-primer complexes, b) incubating the bound NSKF-primer complexes with this solution under conditions that are suitable for extending the complementary strands by one NT , c) washing, d) detection of signals from individual molecules, e) removal of the label from the built-in nucleotides, f) washing.
Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus (a-f ) .If necessary, the cycle is repeated several times (a-f).
Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so gewählt , dass die Polymerasen an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs ( ext ensions fähige NSKF-Primer-Komplexe) in einem Zyklus ein markiertes NT* einbauen können, vorzugsweise an mehr als 90% .The reaction conditions of step (b) in a cycle are selected so that the polymerases can incorporate a labeled NT * on more than 50% of the NSKFs (NSKF primer complexes capable of expansion) which are involved in the sequencing reaction, preferably on more than 90%.
Die Anzahl der durchzuführenden Zyklen hängt dabei von der jeweiligen Aufgabenstellung ab, ist theoretisch nicht beschränkt und liegt vorzugsweise zwischen 20 und 5000.The number of cycles to be carried out depends on the task at hand, and is not theoretically limited and is preferably between 20 and 5000.
Danach wird für jedes fixierte NSKF seine spezifische Sequenz aus der Reihenfolge der eingebauten NTs* ermittelt .Then, for each fixed NSKF, its specific sequence is determined from the order of the installed NTs * .
Aus den überlappenden NSKF-Sequenzen kann in einer Ausführungsform die ursprüngliche NSK-Sequenz rekonstruiert werden ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press , Huang et al . Genom Res . 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J.Comput .Biol . 1994 v.l S.257). Dabei sucht man in der gesamten Population von NSKF- Sequenzen nach Übereinstimmungen/Überlappungen in den Sequenzen von NSKFs . Durch diese Übereinstimmungen/Überlappungen kann man die NSKF in eine Reihe bringen, z.B.:In one embodiment, the original NSK sequence can be reconstructed from the overlapping NSKF sequences ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257). The entire population of NSKF sequences is searched for matches / overlaps in the sequences of NSKFs. Through these matches / overlaps, the NSKF can be aligned, e.g .:
ACTGTGCGTCCGTATGATGGTCATTCCATGACTGTGCGTCCGTATGATGGTCATTCCATG
CATTCCATGGTACGTTAGCTCCTAGCATTCCATGGTACGTTAGCTCCTAG
TCCTAGTAAAATCGTACC .TCCTAGTAAAATCGTACC.
In der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen bewährt, eine Länge der sequenzierten Stücke von mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung von Genomen aus Eukaryonten im Schrotschuss-Verfahren.In practice, when sequencing unknown sequences, it has proven useful to achieve a length of the sequenced pieces of more than 300 bp. This allows the sequencing of genomes from eukaryotes in the shotgun process.
Dabei können die Fehler der Methode mit verschiedenen Mitteln erfasst und korrigiert werden. Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden.The errors in the method can be recorded and corrected using various means. All steps of the process can be largely automated.
Durch die Arbeit mit einzelnen Molekülen ergeben sich große Vorteile gegenüber der früher beschriebenen BASS-Methode :Working with individual molecules offers great advantages over the BASS method described earlier:
1. Da die Moleküle einzeln detektiert werden, besteht keine Gefahr, dass das Signal durch die Desynchronisation in der Population fehlerhaft wird. Für jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter fortgeschritten oder zurückgeblieben ist. Dadurch wird eine hoch parallele Sequenzierung langer NSKF erst möglich.1. Since the molecules are detected individually, there is no risk that the signal will become incorrect due to the desynchronization in the population. For each fixed NSKF created its own sequence. Therefore, it does not matter whether the synthesis of a neighboring molecule has already progressed or lagged behind. This makes highly parallel sequencing of long NSKF possible.
Es ist nicht notwendig, Moleküle in einer definierten Anordnung auf der Oberfläche zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer räumlich definierten Population (was bei BASS-Methoden notwendig ist) . Es ist nicht zwingend notwendig multiple Kopien von den zu analysierenden Nukleinsäureketten herzustellen, so dass PCR- und bzw. oder Klonierungsschritte entfallen können. Dies führt zu einer enormen Beschleunigung der Analyse im Vergleich zu bestehenden Verfahren.It is not necessary to fix molecules in a defined arrangement on the surface, since the signal comes from individual molecules and not from a spatially defined population (which is necessary with BASS methods). It is not absolutely necessary to produce multiple copies of the nucleic acid chains to be analyzed, so that PCR and / or cloning steps can be omitted. This leads to an enormous acceleration of the analysis compared to existing methods.
Das erfindungsgemäße Verfahren zur Analyse der Genexpression erhält durch eine gleichzeitige Sequenzierung einzelner Genproduktmoleküle mehrere Vorteile gegenüber bekannten Methoden der Analyse der Genexpression:The simultaneous sequencing of individual gene product molecules gives the method according to the invention for analyzing gene expression several advantages over known methods of analyzing gene expression:
1) Die Genprodukte können in einer beliebigen Anordnung auf der Oberfläche binden. Eine vorherige aufwendige Synthese von verschiedenen Oligonukleotiden an bestimmten Positionen (wie beispielsweise bei der Hybridisierungsmethode) ist somit nicht notwendig.1) The gene products can bind to the surface in any arrangement. A previous complex synthesis of different oligonucleotides at certain positions (such as in the hybridization method) is therefore not necessary.
2) Das Material kann auf einer standardisierten Oberfläche analysiert werden.2) The material can be analyzed on a standardized surface.
3) Auch die Expression noch unbekannter Gene kann ermittelt werden, weil alle im Ansatz enthaltenen Genprodukte analysiert werden.3) The expression of still unknown genes can also be determined because all gene products contained in the mixture are analyzed.
4). Die große Anzahl der analysierten Moleküle erlaubt auch die Detektion schwach exprimierter Gene.4). The large number of molecules analyzed also allows the detection of poorly expressed genes.
5) Kleinste Mengen an Ausgangsmaterial können eingesetzt werden: mRNA aus einer einzelnen Zelle kann für die Analyse ausreichend sein. 6) Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden.5) Smallest amounts of starting material can be used: mRNA from a single cell can be sufficient for the analysis. 6) All steps of the process can be largely automated.
Die Methode basiert auf mehreren Prinzipien:The method is based on several principles:
1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genügend Informationen zur Identifizierung des korrespondierenden Gens, wenn die Gensequenz selbst bereits in einer Datenbank enthalten ist .1. Short nucleotide sequences (10-50 NTs) contain enough information to identify the corresponding gene if the gene sequence itself is already contained in a database.
Eine Sequenz aus beispielsweise 10 NTs kann mehr als 10δ verschiedene Kombinationen bilden. Das ist z.B. für die meisten Gene im menschlichen Genom, das nach heutiger Schätzung 32000 Gene enthält, ausreichend. Für Organismen mit weniger Genen kann die Sequenz noch kürzer sein.A sequence of, for example, 10 NTs can form more than 10 δ different combinations. For example, this is sufficient for most genes in the human genome, which according to current estimates contains 32,000 genes. The sequence can be even shorter for organisms with fewer genes.
2. Der Methode liegt ein neues Verfahren zur die Sequenzierung einzelner Nukleinsäurekettenmoleküle zugrunde .2. The method is based on a new method for sequencing individual nucleic acid chain molecules.
3. Es können Nukleinsäureketten-Gemische untersucht werden.3. Mixtures of nucleic acid chains can be examined.
4. Die Sequenzierungsreaktion läuft an vielen Molekülen gleichzeitig ab, wobei die Sequenz jeder einzelnen gebundenen Nukleinsäurekette analysiert wird.4. The sequencing reaction takes place simultaneously on many molecules, the sequence of each individual bound nucleic acid chain being analyzed.
Es ist bekannt, dass zur Untersuchung der Genexpression mRNAs oder von der mRNA abgeleitete Nukleinsäureketten (z.B. einzelsträngige cDNAs, doppelsträngige cDNAs, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA) eingesetzt werden kann. Unabhängig von der genauen Zusammensetzung werden sie im folgenden als Genprodukte bezeichnet . Auch Teilsequenzen dieser Genprodukte werden im folgenden als Genprodukte bezeichnet .It is known that mRNAs or nucleic acid chains derived from the mRNA (e.g. single-stranded cDNAs, double-stranded cDNAs, cDNA-derived RNA or cDNA-amplified DNA) can be used to investigate gene expression. Regardless of the exact composition, they are referred to below as gene products. Partial sequences of these gene products are also referred to below as gene products.
Diese Genprodukte stellen ein Gemisch aus verschiedenen Nukleinsäureketten dar.These gene products are a mixture of different nucleic acid chains.
Als Grundlage der Analyse dient die Synthese eines zum Genprodukt komplementären Stranges . Das Ziel der Vorbereitung ist, auf einer planen Oberfläche in zufälliger Weise gebundene Genprodukt-Primer-Komplexe bereitzustellen, an denen der Einbau von NT*s durch die Polymerase stattfinden kann (extensionsfähige Genprodukt- Primer-Komplexe) .The synthesis is based on the synthesis of a strand that is complementary to the gene product. The aim of the preparation is to provide gene product-primer complexes which are bound in a random manner on a flat surface and on which the incorporation of NT * s by the polymerase can take place (gene product-primer complexes which can be extended).
Mit diesen gebundenen Genprodukt-Primer-Komplexen wird die Sequenzierungsreaktion durchgeführt .The sequencing reaction is carried out with these bound gene product-primer complexes.
Sie verläuft in mehreren Zyklen. Pro Zyklus wird jeweils nur ein einziges markiertes NT* in den wachsenden Strang eingebaut . Ein Zyklus umfasst folgende Schritte : a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu gebundenen Genprodukt-Primer-Komplexen, b) Inkubation der gebundenen Genprodukt-Primer-Komplexe mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen, d) Detektion der Signale von einzelnen modifizierten, in die neu synthetisierten Stränge eingebauten NTs*-Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f) Waschen.It runs in several cycles. Only one marked NT * per cycle is installed in the growing strand. A cycle comprises the following steps: a) addition of a solution with labeled nucleotides (NTs * ) and polymerase to bound gene product-primer complexes, b) incubation of the bound gene product-primer complexes with this solution under conditions which extend the complementary strands are suitable for an NT, c) washing, d) detection of the signals from individual modified NTs * molecules incorporated into the newly synthesized strands, e) removal of the label from the built-in nucleotides, f) washing.
Dieser Zyklus kann mehrmals wiederholt werden, so dass von jedem an der Sequenzierungsreaktion teilnehmenden Genprodukt- Primer-Komplex vorzugsweise 10 bis 50 NTs ermittelt werden. Danach erfolgt die Rekonstruktion der Nukleinsäuresequenzen aus den detektierten Signalen. Die ermittelten Sequenzen der gebundenen Genprodukte werden zur Bestimmung der Abundanzen untereinander verglichen und durch Vergleich mit Gensequenzen in Datenbanken bestimmten Genen zugeordnet .This cycle can be repeated several times, so that preferably 10 to 50 NTs are determined for each gene product-primer complex participating in the sequencing reaction. The nucleic acid sequences are then reconstructed from the detected signals. The determined sequences of the bound gene products are compared with one another to determine the abundances and are assigned to specific genes by comparison with gene sequences in databases.
4. Detaillierte Beschreibung4. Detailed description
Allgemeine Prinzipien der Reaktion, Materialauswahl und Materialvorbereitung (Erzeugung kurzer NSKFs, Einführung einer PBS, Einzelstrangvorbereitung, Primerauswahl, Fixierung von NSKFs) , sowie die Detektionsapparatur und Detektion werden am Beispiel des Verfahrens zur Sequenzierung langer NSKs dargestellt. Das Verfahren zur Analyse der Genexpression wird anschließend im Beispiel 3 beschrieben.General principles of reaction, material selection and material preparation (generation of short NSKFs, introduction of a PBS, single strand preparation, primer selection, fixation of NSKFs), as well as the detection apparatus and detection are shown using the example of the procedure for sequencing long NSKs. The method for analyzing gene expression is then described in Example 3.
4.1 Allgemeine Prinzipien der Reaktion4.1 General principles of the reaction
Im folgenden sollen anhand der Sequenzierung eines mehrere Mb langen DNA-Stückes beispielhaft die allgemeinen Prinzipien der Reaktion dargestellt werden (Fig. 1) . Der Sequenzierung und der Rekonstruktion von Nukleinsäurensequenzen liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res . 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J.Comput .Biol. 1994 v.l S.257) . Die Sequenz eines langen DNA- Stücks wird dabei durch die Sequenzierung kleiner DNA-Fragmente und nachfolgender Rekonstruktion ermittelt. Das zu analysierende Material (1) wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird (2) . Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen (3) . Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert (4) . Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktionsoberfläche durchgeführt. Diese Reaktion verläuft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluoreszenzfarbstoff markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion so gesteuert, dass in jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase in den wachsenden Strang eingebaut werden kann. Das wird durch die Verwendung von NTs* erreicht, die an der 3 "-Position der Desoxyribose ein reversibel gekoppeltes, zur Termination führenden Substituenten tragen. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht . Die Polymerase und die markierten NTs* werden gleichzeitig in die Reaktion eigesetzt (5) .Danach wird das Reaktionsgemisch entfernt und die Oberfläche in geeigneter Art und Weise gewaschen (6) . Nun folgt ein Detektionsschritt (7) : Die Oberfläche wird mit einer für die Einzelmoleküldetektion geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steuerungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware) abgescannt und die Signale der einzelnen, eingebauten markierten NTs* identifiziert. Nach dem Detektionsschritt wird die Markierung und der zur Termination führende Substituent von allen eingebauten NTs* entfernt (8) . Nach einem sich anschließenden Waschschritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion einer größeren ursprünglichen DNA-Sequenz (z.B. mehrere Mb langes DNA-Stück) sollen die DNA-Fragmente einige Hundert NT lang sein, falls man die Rekonstruktion nach dem Shotgun-Prinzip durchführt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J . Comput . Biol . 1994 v.l S.257). Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 Zyklen zur Sequenzierung notwendig.In the following, the general principles of the reaction are to be illustrated by way of example using the sequencing of a piece of DNA of several Mb length (FIG. 1). The sequencing and reconstruction of nucleic acid sequences is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p. 868 , Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257). The sequence of a long piece of DNA is determined by sequencing small DNA fragments and subsequent reconstruction. The material to be analyzed (1) is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length (2). Each fragment is then provided with a primer binding site and a primer (3). This mixture of different DNA fragments is now fixed on a flat surface (4). The unbound DNA fragments are removed by a washing step. The sequencing reaction is then carried out on the entire reaction surface. This reaction is cyclical. In the first step of the cycle, an NT * labeled with a fluorescent dye is incorporated into the growing strand: the reaction is controlled so that only one labeled NT * from a polymerase can be incorporated into the growing strand in each cycle. This is achieved by using NTs * which have a reversibly coupled substituent leading to the termination at the 3 "position of the deoxyribose. The incorporation of a further labeled NT * is thereby made impossible. The polymerase and the labeled NTs * become simultaneous (5). The reaction mixture is then removed and washed the surface in a suitable manner (6). Now there is a detection step (7): The surface is scanned with a device suitable for single molecule detection (consisting of light source, microscope, camera, scanning table, computer with control and image recognition or image processing software) and the signals of the individual, built-in marked NTs * identified. After the detection step, the marker and the substituent leading to the termination are removed from all built-in NTs * (8). After a subsequent washing step, a new cycle can begin. For the reconstruction of a larger original DNA sequence (eg several Mb long piece of DNA), the DNA fragments should be several hundred NT long if the reconstruction is carried out according to the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257). Since only one marked NT * is installed per cycle, at least 300 cycles are required for sequencing.
4.2 Auswahl des Materials4.2 Selection of the material
Mit Hilfe der erfindungsgemäßen Methode ist es möglich, sowohl vorselektionierte DNA-Sequenzen (z.B. in YAC- , PAC- , oder BAC- Vektoren (R. Anand et al . NAR 1989 v.17 S.3425, H. Shizuya et al. PNAS 1992 v.89 S.8794, "Construction of bacterial artificial chromosome libraries using the modified PAC System" in "Current Protocols in Human genetics" 1996 John Wiley & Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht vorselektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu analysieren. Durch eine Vorselektion ist es möglich, im Vorfeld relevante Informationen, wie z.B. Sequenz-Abschnitte aus einem Genom oder Populationen an Genprodukten, aus der große Menge genetischer Informationen herauszufiltern und damit die Menge der' zu analysierenden Sequenzen einzuschränken. Besonders hervorzuheben sind die Ausführungsformen, bei denen die erfindungsgemäßen Verfahren ohne Vorselektionierung und ohne eine Vervielfältigung des Materials eingesetzt werden. Verzicht auf PCR und Klonierung bringt eine entscheidende Beschleunigung in der hoch parallelen Analyse von Nukleinsäuresequezen, was mit anderen Verfahren bis jetzt nicht möglich war.With the aid of the method according to the invention, it is possible to preselect DNA sequences (for example in YAC, PAC or BAC vectors (R. Anand et al. NAR 1989 v.17 p. 3425, H. Shizuya et al. PNAS 1992 v.89 p.8794, "Construction of bacterial artificial chromosome libraries using the modified PAC System" in "Current Protocols in Human genetics" 1996 John Wiley & Sons Inc.) cloned sections of a genome) as well as non-preselected DNA (e.g. genomic DNA, cDNA mixtures) to analyze. By preselection, it is possible to filter out relevant information in advance, such as sequence sections from a genome or populations of gene products, from the large amount of genetic information and thus to limit the amount of the sequences to be analyzed. They are particularly noteworthy Embodiments in which the methods according to the invention are used without preselection and without duplicating the material. Dispensing with PCR and cloning brings about a decisive acceleration in the highly parallel analysis of nucleic acid sequences, which has not been possible with other methods until now.
4.3 Vorbereitung des Materials4.3 Preparation of the material
Ziel der Materialvorbereitung ist es, gebundene einzelsträngige NSKFs mit einer Länge von vorzugsweise 50-1000 NTs, einer einzelnen Primerbindungsstelle und einem hybridisierten Primer (gebundene NSKF-Primer-Komplexe) zu erhalten. Diese NSKF-Primer-Komplexe haben beispielsweise die in Fig. 2 dargestellte Struktur. Im einzelnen können sehr variable Konstruktionen aus dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele, wobei die angeführten Methoden einzeln oder in Kombination eingesetzt werden können.The aim of the material preparation is to obtain bound single-stranded NSKFs with a length of preferably 50-1000 NTs, a single primer binding site and a hybridized primer (bound NSKF-primer complexes). These NSKF primer complexes have, for example, the structure shown in FIG. 2. In particular, very variable constructions can be derived from this general structure. To improve the clarity, here are some examples, whereby the methods listed can be used individually or in combination.
4.3.1 Erzeugung kurzer Nukleinsäurekettenfragmente (50-1000 NTs) (Fragmentierungsschritt)4.3.1 Generation of Short Nucleic Acid Chain Fragments (50-1000 NTs) (Fragmentation Step)
Wichtig ist, dass die Fragmentierung der NSKs so erfolgt, dass Fragmente erhalten werden, die überlappende Teilsequenzen der Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht, bei denen unterschiedlich lange Fragmente als Spalt- Produkte in zufallsmäßiger Verteilung entstehen.It is important that the NSKs are fragmented in such a way that fragments are obtained which represent overlapping partial sequences of the total sequences. This is achieved by methods in which fragments of different lengths are formed as fission products in a random distribution.
Erfindungsgemäß kann die Erzeugung der Nukleinsäurekettenfragmente (NSKFs) durch mehrere Methoden erfolgen, z.B. durch die Fragmentierung des Ausgangsmaterials mit Ultraschall oder durch Endonukleasen ("Molecular cloning" . 1989 j.Sambrook et al. Cold Spring Harbor Laborotary Press), wie z.B. durch unspezifische Endonukleasegemische . Erfindungsgemäß wird die Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen so einstellen, dass Fragmente mit einer durchschnittlichen Länge von 100 bp bis 1 kb entstehen. Diese Fragmente werden anschließend an ihren Enden durch das Klenow-Fragment (E.coli- Polymerase I) oder durch die T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J.Sambrook et al . Cold Spring Harbor Laborotary Press) .According to the invention, the nucleic acid chain fragments (NSKFs) can be produced by several methods, for example by fragmentation of the starting material with ultrasound or by endonucleases ("Molecular cloning". 1989 j.Sambrook et al. Cold Spring Harbor Laborotary Press), such as, for example, by non-specific endonuclease mixtures , According to the invention, ultrasound fragmentation is preferred. The conditions can be set so that fragments with an average Length of 100 bp to 1 kb arise. These fragments are then filled in at their ends by the Klenow fragment (E. coli polymerase I) or by the T4 DNA polymerase ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press).
Ausserdem können aus einer langen NSK unter Verwendung randomisierter Primer komplementäre kurze NSKFs synthetisiert werden. Besonders bevorzugt wird diese Methode bei der Analyse der Gen-Sequenzen. Dabei werden an der mRNA einzelsträngige DNA-Fragmente mit randomisierten Primern und einer reversen Transkriptase gebildet (Zhang-J et al . Biochem.J. 1999 v.337 S.231, Ledbetter et al . J.Biol.Chem. 1994 v.269 S.31544, Rolls et al. Anal.Biochem. 1993 v.208 S.264, Decraene et al . Biotechniques 1999 v.27 S.962).In addition, complementary short NSKFs can be synthesized from a long NSK using randomized primers. This method is particularly preferred when analyzing the gene sequences. Single-stranded DNA fragments with randomized primers and a reverse transcriptase are formed on the mRNA (Zhang-J et al. Biochem. J. 1999 v.337 p.231, Ledbetter et al. J.Biol.Chem. 1994 v.269 P.31544, Rolls et al. Anal.Biochem. 1993 v.208 p.264, Decraene et al. Biotechniques 1999 v.27 p.962).
4.3.2 Einführung einer Primerbindungsstelle in das NSKF.4.3.2 Introduction of a primer binding site in the NSKF.
Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das NSKF ermöglichen soll .The primer binding site (PBS) is a sequence section which is intended to enable selective binding of the primer to the NSKF.
In einer Ausführungsform können die Primerbindungsstellen unterschiedlich sein, so dass mehrere unterschiedlche Primer verwendet werden müssen. In diesem Fall können bestimmte Sequenzabschnitte der Gesamtsequez als natürliche PBSs für spezifische Primer dienen. Diese Ausführungsform ist besonders für die Untersuchung bereits bekannter SNP-Stellen geeignet, s. Beispiel 4 "SNP-Analyse mit sequenzspezifischen Primern".In one embodiment, the primer binding sites can be different, so that several different primers must be used. In this case, certain sequence segments of the overall sequence can serve as natural PBSs for specific primers. This embodiment is particularly suitable for the investigation of already known SNP sites, see. Example 4 "SNP analysis with sequence-specific primers".
In einer anderen Ausführungsform ist es aus Gründen der Vereinfachung der Analyse günstig, wenn eine einheitliche Primerbindungsstelle in allen NSKFs vorhanden ist. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Primerbindungsstellen daher in die NSKFs extra eingeführt . Auf diese Weise können Primer mit einheitlicher Struktur für die Reaktion eingesetzt werden. Im folgenden wird diese Ausführungsform detailliert beschrieben.In another embodiment, for reasons of simplification of the analysis, it is favorable if there is a uniform primer binding site in all NSKFs. According to a preferred embodiment of the invention, the primer binding sites are therefore introduced separately into the NSKFs. In this way, primers with a uniform structure can be used for the reaction. This embodiment will be described in detail below.
Die Zusammensetzung der Primerbindungsstelle ist nicht eingeschränkt. Ihre Länge beträgt vorzugsweise zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine funktioneile Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann z.B. eine Biotingruppe sein.The composition of the primer binding site is not restricted. Their length is preferably between 20 and 50 NTs. The primer binding site can carry a functional group for immobilizing the NSKF. This functional group can e.g. be a biotin group.
Als Beispiel für die Einführung einer einheitlichen Primerbindungsstelle werden im folgenden die Ligation und das Nukleotid-Tailing an DNA-Fragmente beschrieben.As an example of the introduction of a uniform primer binding site, the ligation and the nucleotide tailing on DNA fragments are described below.
a) Ligation:a) Ligation:
Dabei wird ein doppelsträngiger Oligonukleotidkomplex mit einer Primerbindungsstelle verwendet (Fig. 3a) . Dieser wird mit kommerziell erhältlichen Ligasen an die DNA-Fragmente ligiert ("Molecular cloning" 1989 J.Sambrook et al . Cold Spring Harbor Laborotary Press) . Es ist wichtig, dass nur eine einzige Primerbindungsstelle an das DNA-Fragment ligiert wird. Das erreicht man z.B. durch eine Modifikation einer Seite des Oligonukleotidkomplexes an beiden Strängen (Fig. 3b) . Die Resultate nach der Ligation bzw. nach anschließender Denaturierung sind in Fig. 3c und 3d dargestellt. Die modifizierenden Gruppen am Oligonukleotidkompex können zur Immobilisation dienen. Die Synthese und die Modifikation eines solchen Oligonukleotidkomplexes kann nach standardisierten Vorschriften durchgeführt werden. Zur Synthese kann z.B. der DNA-Synthesizer 380 A Applied Biosystems verwendet werden. Oligonucleotide mit einer bestimmten Zusammensetzung mit oder ohne Modifikationen sind aber auch als Auftragssynthese kommerziell erhältlich, z.B. von MWG-Biotech GmbH, Germany.A double-stranded oligonucleotide complex with a primer binding site is used (FIG. 3a). This is ligated to the DNA fragments using commercially available ligases ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press). It is important that only a single primer binding site be ligated to the DNA fragment. This is achieved e.g. by modification of one side of the oligonucleotide complex on both strands (FIG. 3b). The results after the ligation or after subsequent denaturation are shown in FIGS. 3c and 3d. The modifying groups on the oligonucleotide complex can be used for immobilization. The synthesis and modification of such an oligonucleotide complex can be carried out according to standardized regulations. For synthesis, e.g. the DNA synthesizer 380 A Applied Biosystems can be used. Oligonucleotides with a certain composition with or without modifications are also commercially available as custom synthesis, e.g. from MWG-Biotech GmbH, Germany.
b) Nukleotid-Tailing:b) Nucleotide tailing:
Statt der Ligation mit einem Oligonukleotid kann man mit einer terminalen Deoxynucleotidyltransferase mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate an das 3 ' -Ende eines ss- DNA-Fragments anknüpfen ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, S.37-38) (Fig. 4), z.B. mehrere Guano- sin-Monophosphate ( (G) n-Tailing genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (C) n-Primers, verwendet.Instead of ligation with an oligonucleotide, one terminal deoxynucleotidyl transferase can be used for several (e.g. between 10 and 20) attach nucleoside monophosphates to the 3 'end of an SS DNA fragment ("molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, p. 37-38) (FIG. 4), for example several guanosine monophosphates (called (G) n-tailing). The resulting fragment is used to bind the primer, in this example a (C) n primer.
4.3.3 Einzelstrang-Vorbereitung4.3.3 Single strand preparation
Für die Sequenzierungsreaktion werden einzelsträngige NSKFs benötigt . Falls das Ausgangsmaterial in doppelsträngiger Form vorliegt, gibt es mehrere Möglichkeiten, aus doppelsträngiger DNA eine einzelsträngige Form zu erzeugen (z.B. Hitze- Denaturierung oder Alkali-Denaturierung) ("Molecular cloning" 1989 J.Sambrook et al . Cold Spring Harbor Laborotary Press) .Single-stranded NSKFs are required for the sequencing reaction. If the starting material is in double-stranded form, there are several possibilities for producing a single-stranded form from double-stranded DNA (e.g. heat denaturation or alkali denaturation) ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press).
4.3.4 Primer für die Sequenzierungsreaktion4.3.4 Primers for the sequencing reaction
Dieser hat die Funktion, den Start an einer einzigen Stelle des NSKF zu ermöglichen. Er bindet an die Primerbindungsstelle im NSKF. Die Zusammensetzung und die Länge des Primers sind nicht eingeschränkt. Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z.B. eine Verbindung zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, dass der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht.This has the function of enabling the start at a single point of the NSKF. It binds to the primer binding site in the NSKF. The composition and the length of the primer are not restricted. In addition to the start function, the primer can also perform other functions, such as to create a connection to the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase.
Bei der Verwendung unterschiedlicher, beispielsweise natürlich in der ursprünglichen Gesamtsequenz vorkommender Primerbindungsstellen, werden die für die jeweilige Primerbindungsstelle sequenzspezifischen Primer verwendet. In diesem Fall wird für die Sequenzierung ein Primergemisch eingesetzt.When using different primer binding sites, for example naturally occurring in the original overall sequence, the sequence-specific primers for the respective primer binding site are used. In this case, a primer mixture is used for sequencing.
Bei einer einheitlichen, beispielsweise durch die Ligation an die NSKFs angekoppelten Primerbindungsstelle wird ein einheitlicher Primer verwendet .With a uniform, for example through the ligation A single primer is used at the primer binding site coupled to NSKFs.
Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF dient, beispielsweise ist eine solche Funktionsgruppe eine Biotingruppe (s. Abschnitt Immobilisierung). Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z.B. mit dem DNA-Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany erstellt werden) .The length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs. The primer can carry a functional group which serves to immobilize the NSKF, for example such a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing. The synthesis of such a primer can e.g. can be carried out with the DNA synthesizer 380 A Applied Biosystems or as a custom synthesis from a commercial provider, e.g. MWG-Biotech GmbH, Germany).
Der Primer kann vor der Hybridisierung an die zu analysierenden NSKFs auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden, beispielsweise nach (McGall et al . US Patent 5412087, Barrett et al . US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al . Science 1991 v.285 S.767, Timofeev et al . Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al . NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v.15 S.5373, Maskos et al . NAR 1992 v.20 S.1679).Prior to hybridization to the NSKFs to be analyzed, the primer can be fixed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 p.767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679).
Die Primer werden auf der Oberfläche beispielsweise in einer Dichte zwischen 10 bis 100 pro 100 μm2, 100 bis 10.000 pro 100 μm2 oder 10.000 bis 1.000.000 pro lOOμm2 gebunden.The primers are on the surface of microns, for example, in a density of between 10 to 100 microns per 100 2, 100 to 10,000 per 100 2, or 10,000 to 1,000,000 per lOOμm 2 bound.
Der Primer oder das Primergemiseh wird mit NSKFs unter Hybridisierungsbedingungen inkubiert, die ihn selektiv an die Primerbindungsstelle des NSKF binden lassen. Diese Primer- Hybridisierung (Annealing) kann vor (1) , während (2) oder nach (3) der Bindung der NSKFs an die Oberfläche erfolgen. Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al. NAR 1990 v.18 S.6409 berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet .The primer or mixture of primers is incubated with NSKFs under hybridization conditions, which allow it to bind selectively to the primer binding site of the NSKF. This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the NSKFs to the surface. The optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be according to Rychlik et al. Calculate NAR 1990 v.18 p.6409. In the following, these hybridization conditions are referred to as standardized hybridization conditions.
Falls eine für alle NSKFs gemeinsame Primerbindungsstelle mit bekannter Struktur beispielsweise durch Ligation eigeführt wird, können Primer mit einheitlicher Struktur eingesetzt werden. Die Primerbindungsstelle kann an ihrem 3 ' -Ende eine funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. Beispielsweise ist diese Gruppe eine Biotin-Gruppe . Der Primer hat eine zur Primerbindungsstelle komplementäre Struktur.If a primer binding site with a known structure that is common to all NSKFs is introduced, for example by ligation, primers with a uniform structure can be used. The primer binding site can carry a functional group at its 3 'end which e.g. is used for immobilization. For example, this group is a biotin group. The primer has a structure that is complementary to the primer binding site.
Ein Beispiel einer Primerbindungstelle und eines Primers ist nachfolgend dargestellt .An example of a primer binding site and a primer is shown below.
5 ' TAATACGACTCACTATAGG3 ' Primer (T7-19-Primer) Biotin-3 ΑTTATGCTGAGTGATATCC5 ' Primerbindungsstelle5 'TAATACGACTCACTATAGG3' primer (T7-19 primer) Biotin-3 ΑTTATGCTGAGTGATATCC5 'primer binding site
4.3.5 Fixierung von NSKF-Primer-Komplexe an die Oberfläche (Bindung bzw. Immobilisierung von NSKFs) .4.3.5 Fixation of NSKF primer complexes on the surface (binding or immobilization of NSKFs).
Ziel der Fixierung (Immobilisierung) ist es, NSKF-Primer- Komplexe auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, dass eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise durch Bindung des Primers (s.o.) oder des NSKF an die Oberfläche erfolgen.The aim of the fixation (immobilization) is to fix NSKF primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the NSKF to the surface.
Die Reihenfolge der Schritte bei der Fixierung von NSKF- Pri er-Komplexen kann variabel sein:The order of the steps in the fixation of NSKF-Pri er complexes can be variable:
1) Die NSKF-Primer-Komplexe können zunächst in einer Lösung durch Hybridisierung (Annealing) gebildet und anschließend an die Oberfläche gebunden werden.1) The NSKF primer complexes can first be formed in a solution by hybridization (annealing) and then bound to the surface.
2) Primer können zunächst auf einer Oberfläche gebunden werden und NSKFs anschließend an die gebundenen Primer hybridisiert werden, wobei NSKF-Primer-Komplexe entstehen (NSKFs indirekt an die Oberfläche gebunden) 3) Die NSKFs können zunächst an die Oberfläche gebunden werden (NSKFs direkt an die Oberfläche gebunden) und im anschließenden Schritt die Primer an die gebundenen NSKFs hybridisiert werden, wobei NSKF-Primer-Komplexe enstehen.2) Primers can first be bound to a surface and NSKFs can then be hybridized to the bound primers, whereby NSKF-primer complexes are formed (NSKFs indirectly bound to the surface) 3) The NSKFs can first be bound to the surface (NSKFs bound directly to the surface) and in the subsequent step the primers can be hybridized to the bound NSKFs, resulting in NSKF-primer complexes.
Die Immobilisierung der NSKFs an die Oberfläche kann daher durch direkte oder indirekte Bindung erfolgen.The NSKFs can therefore be immobilized on the surface by direct or indirect binding.
Oberfläche und Reaktionsoberfläche sind vorliegend als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials. Dieses Material ist vorzugsweise enzymatischen Reaktionen gegenüber inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole), Metall (Gold, Silber, oder Alluminium) oder beliebiges anderes Material, das diesen funktioneilen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.In the present case, the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning. The surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used. The surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
Falls eine gelartige feste Phase (Oberfläche eines Gels) verwendet wird, so kann dieses Gel z.B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbarIf a gel-like solid phase (surface of a gel) is used, this gel can e.g. be an agarose or polyacrylamide gel. The gel is preferably freely passable for molecules with a molecular mass below 5000 Da
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet werden) . Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, dass es zu einer wesentlich geringeren unspezifischen Bindung von NT*s an die Oberfläche kommt. Durch die Bindung der NSKF-Primer- Komplexe auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt(For example, 1 to 2% agarose gel or 10 to 15% polyacrylamide gel can be used). Such a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface. By binding the NSKF primer complexes on the surface, the detection of the fluorescence signals from built-in NTs * is possible. The signals from free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized. The gel is preferably attached to a solid surface
(Fig. 5a) . Diese feste Unterlage kann Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole), Metall (Gold, Silber, oder Alluminium) oder beliebiges anderes Material sein.(Fig. 5a). This firm base can be silicone, glass, ceramic, Plastic (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material.
Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke ist vorzugsweise größer als die einfache Tiefenschärfe des Objektivs sein, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z.B. 0,3 μm beträgt, so liegt die Geldicke vorzugsweise zwischen 1 μm und 100 μm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z.B. Agarose-Kügelchen) zusammengesetzte Oberfläche hergestellt werden (Fig.5b). Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu können. Die Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2 sein.The thickness of the gel is preferably not more than 0.1 mm. The gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not reach the focal plane and are therefore detected. If the depth of focus is 0.3 μm, for example, the gel thickness is preferably between 1 μm and 100 μm. The surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (eg agarose beads) (FIG. 5b). The reaction surface must be large enough to be able to immobilize the necessary number of NSKFs with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktionsgefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchflußvorrichtung ermöglicht einen Austausch der Lösungen im Reaktionsgefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, dass die Oberfläche nicht austrocknet . Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 μl . Idealerweise beträgt sein Volumen weniger als 1 μl . Ein Beispiel eines solchen Duchflußsystems ist in Fig.6 gegeben.The different cycle steps require an exchange of the different reaction solutions above the surface. The reaction surface is preferably part of a reaction vessel. The reaction vessel is in turn preferably part of a reaction apparatus with a flow device. The flow device enables the solutions in the reaction vessel to be exchanged. The exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out. The volume of the reaction vessel is preferably less than 50 μl. Ideally, its volume is less than 1 μl. An example of such a flow system is given in Fig.6.
Falls die Fixierung der NSKF-Primer-Komplexe auf der Oberfläche über die NSKFs erfolgt, kann dies beispielsweise durch die Bindung der NSKFs an einem der beiden Ketten-Enden erfolgen. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al . US Patent 5412087, Nikiforov et al . US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al . US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al . Analytical Biochemistry v.198, S.138, Allemand et al . Biophysical Journal 1997, v.73, S.2064, Trabesinger et al . Analytical Chemistry 1999, v.71, S.279, Osborne et al . Analytical Chemistry 2000, v.72, S.3678, Timofeev et al . Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al . NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v.15 S.5373, Maskos et al . NAR 1992 v.20 S.1679). Die Fixierung kann auch durch eine unspezifische Bindung, wie z.B. durch Austrocknung der NSKFs enthaltenden Probe auf der planen Oberfläche erreicht werden.If the NSKF primer complexes are fixed on the surface via the NSKFs, this can be done, for example, by binding the NSKFs to one of the two chain ends. This can be achieved by appropriate covalent, affine or other bonds. There are many examples of that Immobilization of nucleic acids is known (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, " DNA Microarrays "1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v.198, p.138, Allemand et al. Biophysical Journal 1997, v.73, p.2064, Trabesinger et al. Analytical Chemistry 1999, v .71, p.279, Osborne et al. Analytical Chemistry 2000, v.72, p.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al. NAR 1987 v. 15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679). The fixation can also be achieved by a non-specific binding, such as by drying out the sample containing NSKFs on the flat surface.
Die NSKFs werden auf der Oberfläche beispielsweise in einer Dichte zwischen 10 und 100 NSKFs pro 100 μm2, 100 bis 10.000 pro 100 μm2, 10.000 bis 1.000.000 pro lOOμrn2 gebunden.The NACFs be on the surface of microns, for example, at a density between 10 and 100 microns NACFs per 100 2, 100 to 10,000 per 100 2, bound 10,000 to 1,000,000 per lOOμrn. 2
Die für die Detektion notwendige Dichte von extensionsfähigen NSKF-Primer-Komplexen beträgt ca. 10 bis 100 pro 100 μm2. Sie kann vor, während oder nach der Hybridisierung der Primer an die Genprodukte erreicht werden.The density of NSKF primer complexes which can be extended is necessary for the detection to be approximately 10 to 100 per 100 μm 2 . It can be achieved before, during or after hybridization of the primers to the gene products.
Beispielhaft werden im folgenden einige Methoden zur Bindung von NSKF-Primer-Komplexen näher dargestellt: In einer Ausführungsform erfolgt die Immobilisierung der NSKFs über Biotin-Avidin oder Biotin-Streptavidin-Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5 ' -Ende des Primers enthält Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs (in Lösung) werden diese auf der mit Avidin/Streptavidin beschichteten Oberfläche fixiert. Die Konzentration der mit Biotin markierten Hybridisierungs-Produkte sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, dass eine für die Sequenzierung geeignete Dichte bereits in diesem Schritt erreicht wird.Some methods for binding NSKF-primer complexes are shown in more detail below by way of example: In one embodiment, the NSKFs are immobilized via biotin-avidin or biotin-streptavidin binding. Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer contains biotin. After the labeled primers have hybridized with the NSKFs (in solution), they are fixed on the surface coated with avidin / streptavidin. The concentration of the hybridization products labeled with biotin and the time of incubation of this solution with the surface is chosen such that a density suitable for sequencing is already in this step is achieved.
In einer anderen bevorzugten Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion auf der Oberfläche mit geeigneten Methoden fixiert (s.o.). Die einzelsträngigen NSKFs mit jeweils einer Primerbindungsstelle pro NSKF werden damit unter Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden sie an die fixierten Primer und werden dadurch gebunden (indirekte Bindung) , wobei Primer-NSKF-Komplexe entstehen. Die Konzentration der einzelsträngigen NSKFs und die Hybridisierungsbedingungen werden so gewählt, dass man eine für die Sequenzierung geeignete Immobilisationsdichte von 10 bis 100 extensionsfähigen NSKF-Primer-Komplexen pro 100 μm2 erreicht . Nach der Hybridisierung werden ungebundene NSKFs durch einen Waschschritt entfernt. Bei dieser Ausführungsform wird eine Oberfläche mit einer hohen Primerdichte bevorzugt, z.B. ca. 1.000.000 Primer pro lOOμm2 oder noch höher, da die gewünschte Dichte an NSKF-Primer-Komplexen schneller erreicht wird, wobei die NSKFs nur an einen Teil der Primer binden.In another preferred embodiment, the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above). The single-stranded NSKFs, each with one primer binding site per NSKF, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thereby bound (indirect binding), resulting in primer-NSKF complexes. The concentration of the single-stranded NSKFs and the hybridization conditions are chosen such that an immobilization density of 10 to 100 NSKF primer complexes capable of extension per 100 μm 2 suitable for sequencing is achieved. After hybridization, unbound NSKFs are removed by a washing step. In this embodiment, a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 μm 2 or even higher, since the desired density of NSKF-primer complexes is achieved more quickly, the NSKFs only binding to a part of the primers ,
In einer anderen Ausführungsform werden die NSKFs an die Oberfläche direkt gebunden (s.o.) und anschließend mit Primern unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte von ca. 10 bis 100 NSKFs pro lOOμm2 wird man versuchen alle verfügbaren NSKFs mit einem Primer zu versehen und für die Sequenzierugnsreaktion verfügbar zu machen. Dies kann z.B. durch hohe Primerkonzentration, beispielsweise 1 bis 100 mmol/1, erreicht werden. Bei einer höheren Dichte der fixierten NSKFs auf der Oberfläche, beispielsweise 10.000 bis 1.000.000 pro lOOμm2, kann die für die optische Detektion notwendige Dichte der NSKF-Primer-Komplexe während der Primer-Hybridisierung erreicht werden. Dabei sind die Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, Primerkonzentration) so zu wählen, dass die Primer nur an einen Teil der immobilisierten NSKFs binden. Falls die Oberfläche einer festen Phase (z.B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlösung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.In another embodiment, the NSKFs are bound directly to the surface (see above) and then incubated with primers under hybridization conditions. With a density of approx. 10 to 100 NSKFs per 100 μm 2 , attempts will be made to prime all available NSKFs and to make them available for the sequencing reaction. This can be achieved, for example, by high primer concentration, for example 1 to 100 mmol / 1. With a higher density of the fixed NSKFs on the surface, for example 10,000 to 1,000,000 per 100 μm 2 , the density of the NSKF-primer complexes required for optical detection can be achieved during the primer hybridization. The hybridization conditions (eg temperature, time, buffer, primer concentration) should be selected so that the primers only bind to a part of the immobilized NSKFs. If the surface of a solid phase (eg silicone or glass) is used for immobilization, a blocking solution is preferably applied to the surface before step (a) in each cycle, which serves to avoid non-specific adsorption of NTs * on the surface. For example, an albumin solution (BSA) with a pH between 8 and 10 fulfills these conditions for a blocking solution.
4. Wahl der Polymerase4. Choice of polymerase
Als Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA-Polymerasen ohne 3 '-5' Exonuklease-Aktivität (DNA- Replication" 1992 Ed. A. Kornberg, Freeman and Company NY) , z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2"In principle, all DNA-dependent DNA polymerases without 3 '-5' exonuclease activity (DNA replication "1992 Ed. A. Kornberg, Freeman and Company NY), for example modified T7 polymerase of the type" Sequenase Version 2, are suitable as polymerases "
(Amersham Pharmacia Biotech), 3 '-5' exonuklease freies Klenow Fragment der DNA-Polymerase I (Amersham Pharmacia Biotech) , Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie beispielsweise Taq-Polymerase (GibcoBRL) , proHATM Polymerase(Amersham Pharmacia Biotech), 3 '-5' exonuclease-free Klenow fragment of DNA polymerase I (Amersham Pharmacia Biotech), polymerase beta of various origins (Animal Cell DNA Polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHATM polymerase
(Eurogentech) .(Eurogentech).
Polymerasen mit 3 ' -5 ' Exonuklease-Aktivität können eingesetzt werden (z.B. Klenow-Fragment der E. coli-Polymerase I), sofern Reaktionsbedingungen gewählt werden, die vorhandene 3' -5' Exonuklease-Aktivität unterdrücken, wie z.B. ein niedriger pH- Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem. 1964 v.239 S.233) oder Zugabe von NaF zur Einbaureaktion. Eine andere Möglichkeit besteht in der Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel et al . PNAS 1981, v.78 S.6734). Dabei werden eingebaute NTs* von der 3 ' -5 ' Exonuklease-Aktivität der Polymerase nicht angegriffen. Im folgenden werden all diese Polymerasearten als "Polymerase" bezeichnet. 4 . 5 ChemiePolymerases with 3 '-5' exonuclease activity can be used (eg Klenow fragment of E. coli polymerase I), provided reaction conditions are selected, suppress the existing 3 '-5' exonuclease activity, such as a low pH Value (pH 6.5) for the Klenow fragment (Lehman and Richardson, J. Biol. Chem. 1964 v.239 p.233) or addition of NaF for the installation reaction. Another possibility is to use NTs * with a phosphorothioate compound (Kunkel et al. PNAS 1981, v.78 p.6734). Built-in NTs * are not attacked by the 3 '-5' exonuclease activity of the polymerase. All these types of polymerases are referred to below as "polymerase". 4th 5 chemistry
4.5.1 Allgemeine NT-Struktur4.5.1 General NT structure
In den erfindungsgemäßen Verfahren können unterschiedliche NT*s verwendet werden (vorzugsweise 2 ' -deoxy-Nukleotid- Triphosphate) , die an ihrer 3 ' -Position des Riboseringes einen Substituenten tragen. Dieser Substituent kann alleine oder zusammen mit dem Fluoreszenzfarbstoff zur Termiantion der Einbaureaktion führen und kann unter milden Bedingngen vom Nukleotid abgespalten werden. An diesen Substituenten ist ein für das jeweilige NT* charakteristischer Fluoreszenzfarbstoff angekoppelt, so dass der Substituent auch die Rolle eines Linkers zwischen dem Nukleotid und dem Fluoreszenzfarbstoff übernimmt. Der Fluoreszenzfarbstoff wird vorzugsweise an diesen Linker durch eine unter milden Bedingungen spaltbare Bindung angekoppelt .Different NT * s (preferably 2'-deoxy nucleotide triphosphates) which carry a substituent at their 3 'position of the ribose ring can be used in the methods according to the invention. This substituent, alone or together with the fluorescent dye, can lead to the termination of the incorporation reaction and can be split off from the nucleotide under mild conditions. A fluorescent dye which is characteristic of the respective NT * is coupled to these substituents, so that the substituent also assumes the role of a linker between the nucleotide and the fluorescent dye. The fluorescent dye is preferably coupled to this linker by a bond which can be cleaved under mild conditions.
Unter ^milden Bedingungen" werden Spaltungsbedingungen verstanden, die weder zur Denaturierung des Primer- Nukleinsäure-Komplexes führen, noch zur Spaltung seiner einzelner Bestandteile."Mild conditions" are understood to mean cleavage conditions which neither lead to denaturation of the primer-nucleic acid complex, nor to the cleavage of its individual components.
Formeln (1-3) stellen Beispiele für die reversiblen spaltbaren Terminatoren dar:Formulas (1-3) are examples of the reversible cleavable terminators:
1) NT-3' -O-S(l) -F1) NT-3 '-O-S (l) -F
2) NT-3'-0-S(2) -N-F2) NT-3'-0-S (2) -N-F
3) NT-3' -0-S(2) -N-L-F3) NT-3 '-0-S (2) -N-L-F
NT-3'-0 - stellt den 2 ' -Deoxy-Nukleosid-Triphosphat-Rest dar.NT-3'-0 - represents the 2 'deoxy nucleoside triphosphate residue.
S(l) - stellt einen Substituenten (Formel 1) dar, der unter milden Bidingungen vom NT* abgespalten werden kann. An diesen Substituenten ist ein Fluoreszenzfarbstoff (F) gekoppelt .S (l) - represents a substituent (Formula 1) that can be split off from the NT * under mild conditions. A fluorescent dye (F) is coupled to these substituents.
S(2)-N - stellt einen weiteren Substituenten (Formel 2 und 3) dar, der unter milden Bidingungen vom NT* abgespalten werden kann. Dieser Substituent ist mit dem Fluoreszenzfarbstoff (F) durch eine unter milden Bedingungen spaltbare Gruppe (N) verbunden. Der Fluoreszenzfarbstoff kann unmittelbar an die spaltbare Gruppe (Formel 2) oder durch einem weiteren Linker (L) (Formel 3) gekoppelt sein.S (2) -N - represents another substituent (formula 2 and 3), which can be split off from the NT * under mild conditions. This substituent is linked to the fluorescent dye (F) by a group (N) which is cleavable under mild conditions. The fluorescent dye can be coupled directly to the cleavable group (formula 2) or by a further linker (L) (formula 3).
Beispiele für NT*-Strukturen, NT*-Synthese, zur Polymerase- Wahl für die Einbaureakiton , Reaktionsbedingungen der NT*- Einbaureakion und Abspaltungsreaktion sind in (Kwiatkoxski WO-Patent 01/25247, Kwiatkowski US-Patent 6.255.475, Conard et al. US-Patent 6.001.566, Dower (US Patent 5.547.839), Canard et al . (US Patent 5.798.210), RasolonjatovoExamples of NT * structures, NT * synthesis, polymerase selection for the incorporation reaction, reaction conditions of the NT * incorporation reaction and cleavage reaction are described in (Kwiatkoxski WO patent 01/25247, Kwiatkowski US patent 6,255,475, Conard et al U.S. Patent 6,001,566, Dower (U.S. Patent 5,547,839), Canard et al. (U.S. Patent 5,798,210), Rasolonjatovo
(Nucleosides & Nucleotides 1999, v.18 S.1021), Metzker et al .(Nucleosides & Nucleotides 1999, v.18 p.1021), Metzker et al.
(NAR 1994, v.22, S.4259), Welch et al . (Nucleosides & Nucleotides 1999, v.18, S.197) beschrieben.(NAR 1994, v.22, p.4259), Welch et al. (Nucleosides & Nucleotides 1999, v.18, p.197).
4.5.2 Marker, Fluorophore4.5.2 Markers, fluorophores
Jedes Nukleotid ist mit einem charakteristischen Marker (F) markiert. Der Marker ist ein fluoreszierender Farbstoff. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff folgenden Anforderungen genügt :Each nucleotide is marked with a characteristic marker (F). The marker is a fluorescent dye. The choice is not restricted if the dye meets the following requirements:
a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungena) The detection apparatus used must have this marker as the only molecule bound to DNA under mild conditions
(vorzugsweise Reaktionsbedingungen) identifizieren können. Die Farbstoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich gequencht .(preferably reaction conditions) can identify. The dyes preferably have great photostability. Their fluorescence is preferably not quenched by the DNA or only to a minor extent.
b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.b) The dye bound to the NT must not cause an irreversible disturbance of the enzymatic reaction.
c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden. d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.c) NTs * marked with the dye must be incorporated into the nucleic acid chain by the polymerase. d) When labeled with different dyes, these dyes should not have any significant overlaps in their emission spectra.
Beispielsweise sind einige Fluorophore, die im Rahmen der vorliegenden Erfindung verwendbar sind, in "Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin- Farbstoffe und deren Abkömmlinge (z.B. Cy2 , Cy3 , Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und deren Abkömmlinge (z.B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al . US- Patent 6.130.101) und Porphyrine (Porphyrin-Systems, Deutschland) . Diese Farbstoffe sind kommerziell erhältlich.For example, some fluorophores which can be used in the context of the present invention are compiled with structural formulas in "Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes. According to the invention, the following classes of dyes are preferably used as markers: cyanine dyes and their derivatives (for example Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US Pat. No. 5,268,486), rhodamines and their derivatives (for example TAMRA, TRITC, RG6, R110 , ROX, Molecular Probes, see manual), xanthene derivatives (e.g. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US Pat. No. 6,130,101) and porphyrins (Porphyrin-Systems, Germany). These dyes are commercially available.
Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe werden an das NT* über einen spaltbaren Linker gebunden. Die Farbstoffe können an den Linker z.B. über Thiocyanat- oder Ester-Bindung gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al . Methods in Enzymology 1997 v.278 S.363, Waggoner Methods in Enzymology 1995 v.246 S.362)Depending on the spectral properties and the equipment available, appropriate dyes can be selected. The dyes are bound to the NT * via a cleavable linker. The dyes can be attached to the linker e.g. via thiocyanate or ester linkage ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v.278 p.363, Waggoner Methods in Enzymology 1995 v.246 p.362)
4.5.3 Spaltbare Bindung zwischen dem Nukleotid und dem Substituenten, Spaltung.4.5.3 Cleavable bond between the nucleotide and the substituent, cleavage.
Der zur Termination führende Substituent ist an das NT durch eine unter milden Bedingungen spaltbare Bindung gekoppelt .The substituent leading to the termination is coupled to the NT by a bond which can be split under mild conditions.
Beispiele für diese Verbindungen stellen Ester und Acetale dar.Examples of these compounds are esters and acetals.
Die Spaltung der Ester erfolgt vorzugsweise im basischen pH- Bereich (z.B. 9 bis 11). Die Spaltung von Acetalen erfolgt im saueren Bereich (z.B. zwischen 3 und 4).The esters are preferably cleaved in the basic pH Range (e.g. 9 to 11). Acetals are split in the acidic range (for example between 3 and 4).
Ester können auch enzymatisch durch Polymerasen oder Esterasen abgespalten werden.Esters can also be eliminated enzymatically by polymerases or esterases.
In einer bevorzugten Ausführungsform der Erfindung wird der Substituent zusammen mit dem Fluoreszenzfarbstoff in einem Schritt abgespalten.In a preferred embodiment of the invention, the substituent is split off together with the fluorescent dye in one step.
4.5.4 Spaltbare Bindung zwischen dem Substituenten und dem Fluoreszenzfarbstoff, Spaltung.4.5.4 Cleavable bond between the substituent and the fluorescent dye, cleavage.
In einer anderen bevorzugten Ausführungsform der Erfindung ist der Fluoreszenzfarbstoff an den Substituenten durch eine unter milden Bedingungen spaltbare Gruppe gekoppelt .In another preferred embodiment of the invention, the fluorescent dye is coupled to the substituents by a group which is cleavable under mild conditions.
Vorzugsweise gehört die genannte Gruppe zu chemisch oder enzymatisch spaltbaren oder photolabilen Verbindungen. Ester-, Thioester- , Disulfid-Verbindungen und photolabile Verbindungen eignen sich besonders gut als spaltbare Verbindung zwischen dem Substituenten und dem Fluoreszenzfarbstoff .The group mentioned preferably belongs to chemically or enzymatically cleavable or photolabile compounds. Ester, thioester, disulfide compounds and photolabile compounds are particularly suitable as a cleavable connection between the substituent and the fluorescent dye.
Als Beispiele von chemisch spaltbaren Gruppen sind Ester-, Thioester- und Disulfid-Verbindungen bevorzugt (^Chemistry of protein conjugation and crosslinking"" Shan S. Wong 1993 CRC Press Inc., Herman et al . Method in Enzymology 1990 v.184 S.584, Lomant et al . J.Mol. Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience Publ . ) . Beispiele für photolabile Verbindungen können in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 S.l, V. Pillai Org. Photochem. 1987 v.9 S.225, Dissertation i^Neue photolabile Schutzgruppen für die lichtgesteuerte Oligonucleotidsynthese"" H. Giegrich, 1996, Konstanz, Dissertation ξξNeue photolabile Schutzgruppen für die lichtgesteuerte Oligonucleotidsynthese" S.M. Bühler, 1999, Konstanz) .As examples of chemically cleavable groups, ester, thioester and disulfide compounds are preferred (^ Chemistry of protein conjugation and crosslinking "" Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v. 184 S. 584, Lomant et al. J. Mol. Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience Publ.). Examples of photolabile compounds can be found in the following references: "Protective groups in organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 Sl, V. Pillai Org. Photochem. 1987 v.9 p.225, dissertation i ^ New photolabile protective groups for light-controlled oligonucleotide synthesis "" H. Giegrich, 1996, Konstanz, dissertation ξξNew photolabile protective groups for light-controlled oligonucleotide synthesis "SM Bühler, 1999, Constance).
Der Spaltungsschritt ist in jedem Zyklus vorhanden und muß unter milden Bedingungen verlaufen, so dass die Nukleinsäuren nicht beschädigt oder modifiziert werden.The cleavage step is present in every cycle and must take place under mild conditions so that the nucleic acids are not damaged or modified.
Die Spaltung läuft bevorzugt chemisch (z.B. in milder saurer oder basischer Umgebung für eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittels, z.B. Dithiothreitol oder Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- Verbindung) , oder physikalisch (z.B. durch Beleuchtung der Oberfläche mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen Gruppe, Dissertation ξ§Neue photolabile Schutzgruppen für die lichugesteuerte Oligonucleotidsynthese""" H. Giegrich, 1996, Konstanz) ab.The cleavage preferably proceeds chemically (for example in a mild acidic or basic environment for an ester compound or by adding a reducing agent, for example dithiothreitol or mercaptoethanol (Sigma) when cleaving a disulfide compound), or physically (for example by illuminating the surface with light a certain wavelength for the cleavage of a photolabile group, dissertation ξ§New photolabile protecting groups for the light-controlled oligonucleotide synthesis """ H. Giegrich, 1996, Constance).
In dieser Ausführungsform wird nach der Detektion zunächst der Fluoreszenzfarbstoff abgespalten und erst dann der an die 3 ' -Position gekoppelte, zur Termination führende Substituent.In this embodiment, after the detection, the fluorescent dye is first split off and only then is the substituent which is coupled to the 3 'position and leads to the termination.
4.5.5 Farbiges Kodierungsschema, Anzahl der Farbstoffe Jedes NT* muß eindeutig mit einem charakteristischen Farbstoff markiert sein. Vorzugsweise kann man einen Zyklus durchführen mit :4.5.5 Color coding scheme, number of dyes Each NT * must be clearly marked with a characteristic dye. A cycle can preferably be carried out with:
a) vier verschieden markierten NT*s b) zwei verschieden markierten NT*s c) einem markierten NT* d) zwei verschieden markierten NT*s und zwei unmarkierten NTs,a) four differently marked NT * s b) two differently marked NT * s c) one marked NT * d) two differently marked NT * s and two unmarked NTs,
(auch andere Kombinationen sollten einem Fachmann naheliegend erscheinen) d.h.(other combinations should also be obvious to a specialist) i.e.
a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.a) You can mark all 4 NTs with different dyes and use all 4 at the same time in the reaction. The sequencing of a nucleic acid chain is achieved with a minimum number of cycles. However, this variant of the invention places high demands on the detection system: 4 different dyes have to be identified in each cycle.
b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z.B. A und G tragen die Markierung "X" , C und U tragen die Markierung "Y" . In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n+1) werden dann U* und G* zugegeben .b) To simplify the detection, a label with two dyes can be selected. Two pairs of NTs * are formed, each marked differently, eg A and G are marked "X", C and U are marked "Y". Two differently labeled NTs * are used simultaneously in the reaction in one cycle (s), for example C * in combination with A * , and U * and G * are then added in the subsequent cycle (n + 1).
c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen.c) You can also use only a single dye to mark all 4 NTs * and use only one NT * per cycle.
d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . Diese Ausführungsform kann verwendet werden, um Varianten (z.B. Mutationen, oder alternativ gespleißte Gene) einer bereits bekannten Sequenz zu ermitteln.d) In a technically simplified embodiment, two differently marked NT * s are used per cycle and two unmarked NTs (so-called 2NT * s / 2NTs method). This embodiment can be used to determine variants (eg mutations, or alternatively spliced genes) of an already known sequence.
Unter Reaktionsbedingungen erfolgt der Einbau von NT*s in die NSKFs vorzugsweise so, daß an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das hängt damit zusammen, daß an manchen Nukleinsäureketten die Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reaktion im Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.Under reaction conditions, the incorporation of NT * s into the NSKFs preferably takes place in such a way that a labeled NT * is incorporated in more than 50% of the NSKFs involved in the sequencing reaction, preferably in more than 90%. This is due to the fact that the reaction takes place very slowly on some nucleic acid chains. An installation of the NTs * at every complementary position in each cycle is aimed for, but is not necessary because only the successful installation reactions are detected and evaluated; a delayed reaction in the subsequent cycle does not lead to a sequencing error.
Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet . Es können aber auch verschiedene Polymerasen für verschiedene NTs* eingesetzt werden.The same polymerase is preferred for all NTs * used. However, different polymerases can also be used for different NTs * .
4.6 Detektionsapparatur4.6 Detection equipment
Einzelne Moleküle auf einer Oberfläche kann man mit verschiedenen Methoden untersuchen. Es sind mehrere Verfahren bekannt: z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld-Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Individual molecules on a surface can be examined using various methods. Several methods are known: e.g. AtomForce microscopy, electron microscopy, near-field fluorescence microscopy, wide-field fluorescence
Mikroskopie, TIR-Mikroskopie usw. (Science 1999 v.283 1667, Unger et al . BioTechniques 1999 v.27 S.1008, Ishijaima et al . Cell 1998 v.92 S.161, Dickson et al . Science 1996 v.274 S.966, Xie et al. Science 1994 v.265 S.361, Nie et al . Science 1994 v.266 S.1018, Betzig et al . Science 1993 v.262 S.1422).Microscopy, TIR microscopy etc. (Science 1999 v.283 1667, Unger et al. BioTechniques 1999 v.27 p.1008, Ishijaima et al. Cell 1998 v.92 p.161, Dickson et al. Science 1996 v.274 P.966, Xie et al. Science 1994 v.265 p.361, Nie et al. Science 1994 v.266 p.1018, Betzig et al. Science 1993 v.262 p.1422).
Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem Weitfeld-Fluoreszenz-Mikroskop (Epifluoreszenz) oder einem Laser-Scanning-Mikroskop (Epifluoreszenz) oder einem TIRF- Microskop (Total Internal Reflection Fluorescence Microscope) .According to the invention, fluorescence signals of individual NTs * built into the nucleic acid chain are preferably measured using a wide-field fluorescence microscope (epifluorescence) or a laser scanning microscope (epifluorescence) or a TIRF microscope (Total Internal Reflection Fluorescence Microscope).
Es sind verschiedene Varianten der Konstruktion einer solchen Apparatur möglich (Weston et al . J.Chem.Phys. 1998 v.109 S.7474, Trabesinger et al . Anal. Chem. 1999 v.71 S.279, Adachi et al. Journal of Microscopy 1999 v.195 S.125, Unger et al . BioTechniques 1999 v.27 S.1008, Ishijaima et al . Cell 1998 v.92 S.161, Dickson et al . Science 1996 v.274 S.966, Tokunaga et al. Bichem.Biophys.Res.Com. 1997 v.235 S.47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press ). Unterschiede in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die Vorrichtung für das Anregungslicht kann z.B. auf der Basis eines Lasers, einer Lampe oder von Dioden funktionieren. Für die Detektionsvorrichtung können sowohl CCD-Kameras als auch PMT dienen. Andere Beispiele für technische Details siehe ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press). Es ist nicht die Aufgabe dieser Erfindung, alle möglichen technischen Varianten einer Detektionsvorrichtung aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur wird in einem Schema Fig. 8 erläutert. Sie besteht aus folgenden Elementen:Various variants of the construction of such an apparatus are possible (Weston et al. J. Chem. Phys. 1998 v.109 p.7474, Trabesinger et al. Anal. Chem. 1999 v.71 p.279, Adachi et al. Journal of Microscopy 1999 v.195 p.125, Unger et al. BioTechniques 1999 v.27 p.1008, Ishijaima et al. Cell 1998 v.92 p.161, Dickson et al. Science 1996 v.274 p.966, Tokunaga et al. Bichem.Biophys.Res.Com. 1997 v.235 p.47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). Differences in their concrete structure result from the variation of their individual parts. The device for the excitation light can function, for example, on the basis of a laser, a lamp or diodes. For the detection device can serve both CCD cameras and PMT. For other examples of technical details see ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). It is not the object of this invention to list all possible technical variants of a detection device. The basic structure of a suitable apparatus is explained in a diagram in FIG. 8. It consists of the following elements:
Lichtquelle zur Anregung der Fluoreszenz (1)Light source to excite fluorescence (1)
Lichtleitender Teil (2)Light guiding part (2)
Scantisch (3)Scan table (3)
Vorrichtung zur Selektion von Spektren (4)Spectra selection device (4)
Detektionsvorrichtung (5)Detection device (5)
Computer mit Steuerungs- und Analysefunktionen (6)Computers with control and analysis functions (6)
Diese Elemente der Apparatur können kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon. Olympus) .These elements of the apparatus can be purchased commercially (microscope companies: Zeiss, Leica, Nikon. Olympus).
Im folgenden soll beispielsweise eine für die Detektion einzelner Moleküle geeignete Kombination aus diesen Elementen vorgestellt werden:In the following, for example, a combination of these elements suitable for the detection of individual molecules will be presented:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mitWide field fluorescence microscope Axioplan 2 (Zeiss) with
QuecksilberdampflampeMercury vapor lamp
Objektiv Planneofluar lOOx, NA 1.4 (Zeiss)Objective Planeofluar lOOx, NA 1.4 (Zeiss)
Kamera Photometrix oder AxioCam (Zeiss)Camera Photometrix or AxioCam (Zeiss)
Computer mit Software zur Steuerung und AnalyseComputer with software for control and analysis
Nachfolgend soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei die allgemeinen Regeln der Fluoreszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS' Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press).The procedure for detection will be explained below. Please note the general rules of fluorescence microscopy ("Confocal Laser Scanning Microscopy") 1997 Ed. Sheppard, BIOS ' Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press).
Die Detektion umfaßt folgende Phasen:The detection comprises the following phases:
1) Vorbereitung zur Detektion1) Preparation for detection
2) Durchführung eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt als Scanvorgang abläuft und folgende Operationen umfaßt: a) Einstellung der Position des Objektivs (X, Y-Achse) , b) Einstellung der Fokusebene (Z-Achse) , c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF, d) Verschiebung zur nächsten Position auf der Oberfläche .2) Execution of a detection step in each cycle, each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the lens (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the Signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective NSKF, d) shift to the next position on the surface.
Die Signale von in die NSKFs eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press). Beispielsweise wird ein diskontinuierlicher Scanvorgang gewählt . Dabei wird das Objektiv schrittweise über die Oberfläche bewegt (Fig. 8a) , so dass von jeder Oberflächenposition ein zweidimensionales Bild (2D-Bild) entsteht (Fig 8b, c).The signals from NTs * built into the NSKFs are registered by scanning the surface. The scanning process can be carried out in various ways ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). For example, a discontinuous scanning process is selected. The objective is moved step by step over the surface (FIG. 8a), so that a two-dimensional image (2D image) is created from each surface position (FIG. 8b, c).
Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: z.B. durch den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der Mikroskopie) . Als Beispiel wird die Detektion einzelner Moleküle mit einer CCD-Kamera beschrieben.This 2D image can be created using various methods: for example by laser scanning a position of the microscope field (laser scanning microscopy) or by Camera recording at one position (see manuals of microscopy). The detection of individual molecules with a CCD camera is described as an example.
Die Detektion wird schematisch am Beispiel der Sequenzierung eines 1Mb langen DNA-Stücks erläutert:The detection is explained schematically using the example of sequencing a 1Mb piece of DNA:
1) Vorbereitung zur Detektion:1) Preparation for detection:
Am Anfang wird festgelegt, wie viele NSKF-Sequenzen zur Rekonstruktion der ursprünglichen Sequenz analysiert werden müssen. Im Fall einer Rekonstruktion nach dem Schrotschuß- Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J. Comput .Biol . 1994 v.l S.257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs bestimmt. 2) Die Gesamtlänge der zu analysierenden Sequenz ist wichtig. 3) Bei der Sequenzierung muß ein bestimmtes Maß an Redundanz erreicht werden, um die Genauigkeit zu steigern und eventuelle Fehler zu korrigieren. Insgesamt ist zur Rekonstruktion des größten Teils der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d.h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten gebraucht . Bei einer durchschnittlichen Sequenzlänge von 400 bp pro NSKF benötigt man entsprechend 25.000 bis 250.000 DNA-Fragmente .At the beginning it is determined how many NSKF sequences have to be analyzed in order to reconstruct the original sequence. In the case of a reconstruction according to the shotgun method ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p. 868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257) the following factors play a role: 1) Each NSKF is used in the Sequencing determined a sequence of approximately 300-500 NTs. 2) The total length of the sequence to be analyzed is important. 3) A certain degree of redundancy must be achieved in the sequencing in order to increase the accuracy and to correct any errors. Overall, approximately 10 to 100 times the amount of raw sequences is required to reconstruct most of the original sequence, i.e. in this one Mb example, 10 to 100 Mb raw sequence data is needed. With an average sequence length of 400 bp per NSKF, 25,000 to 250,000 DNA fragments are required.
2) Durchführung eines Detektionsschrittes in jedem Zyklus2) Performing a detection step in every cycle
Zur Sequenzierung müssen die Positionen der NSKFs bestimmt werden, damit man eine Grundlage für die Zuordnung der Signale hat . Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob die Signale einzelner Moleküle von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen NTs* . Diese Positionen können mit verschiedenen Methoden identifiziert werden. In einer bevorzugten Ausführungsform werden die Positionen gebundener NSKF-Primer-Komplexe während der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, dass die Signale von den in die Nukleinsäurekette eingebauten NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung der Nukleinsäureketten gewährleistet. Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen der Oberfläche .The positions of the NSKFs must be determined for sequencing so that one has a basis for the assignment of the signals. Knowing these positions allows a statement to be made as to whether the signals of individual molecules come from built-in NTs * or from randomly bound NTs * . These positions can be identified using various methods. In a preferred embodiment, the positions of bound NSKF primer complexes are identified during sequencing. This makes use of the fact that the signals from the NTs * built into the nucleic acid chain always have the same coordinates. This is ensured by fixing the nucleic acid chains. The non-specifically bound NTs * bind randomly at different points on the surface.
Zur Identifizierung der Positionen von fixierten NSKFs werden die Signale auf Übereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft. Das kann z.B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende Koordinaten werden als Koordinaten der DNA-Fragmente bewertet und gespeichert .To identify the positions of fixed NSKFs, the signals are checked for agreement of their coordinates from several successive cycles. This can e.g. at the beginning of the sequencing. The matching coordinates are evaluated as coordinates of the DNA fragments and saved.
Das Scan-System muß reproduzierbar über mehrere Zyklen die Oberfläche abscannen können. X,Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von einem Computer kontrolliert werden. Stabilität und Reproduzierbarkeit der Einstellung von Objektivpositionen in jedem Scanvorgang entscheiden über die Qualität der Detektion und somit über die Identifizierung der Signale einzelner Moleküle.The scan system must be able to scan the surface reproducibly over several cycles. X, Y and Z axis settings at each surface position can be controlled by a computer. The stability and reproducibility of the setting of lens positions in each scanning process determine the quality of the detection and thus the identification of the signals of individual molecules.
a) Einstellung der Position des Objektivs (X, Y-Achse)a) Setting the position of the lens (X, Y axis)
Die mechanische Instabilität der kommerziell erhältlichen Scantische und die geringe Reproduzierbarkeit der wiederholten Einstellung derselben X, Y-Positionen machen eine präzise Analysen der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung der Koordinaten bei wiederholten Einstellungen zu verbessern bzw. mögliche Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit angeführt. Nach einer groben mechanischen Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 μm sind durchaus möglich) , kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom Muster dient als Koordinatensystem für das Bild mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist, dass keine weiteren Bewegungen der Oberfläche zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen Molekülen werden in Relation zum Muster gesetzt, so dass eine X, Y-Abweichung in der Musterposition gleiche X,Y- Abweichung in der Position der Signale einzelner Moleküle bedeutet. Das Kontrollbild vom Muster kann vor, während oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches Kontrollbild muß entsprechend bei jeder Einstellung auf einer neuen Oberflächenposition .gemacht werden.The mechanical instability of the commercially available scanning tables and the low reproducibility of repeated adjustment of the same X, Y positions make it difficult to precisely analyze the signals of individual molecules over several cycles. There are many ways to improve the coincidence of the coordinates with repeated settings or to check possible deviations. A control option is given as an example. After a rough mechanical adjustment of the lens position, a control image is made of a pattern firmly attached to the surface. Even if the mechanical adjustment is not has exactly the same coordinates (deviations of up to 10 μm are quite possible), you can make a correction using an optical control. The control image from the sample serves as a coordinate system for the image with signals from built-in NTs * . A prerequisite for such a correction is that no further surface movements are made between these two images. Signals from individual molecules are placed in relation to the pattern, so that an X, Y deviation in the pattern position means the same X, Y deviation in the position of the signals of individual molecules. The control image of the pattern can be taken before, during or after the detection of individual molecules. Such a control picture must be made accordingly with each setting on a new surface position.
b) Einstellung der Fokusebene (Z-Achse)b) Setting the focus plane (Z axis)
Die Oberfläche ist nicht absolut plan und weist verschiedene Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objek- tiv-Abstand beim abscannen benachbarter Stellen. Diese Unterschiede im Abstand können dazu führen, dass einzelne Moleküle die Fokusebene verlassen und so der Detektion entgehen.The surface is not absolutely flat and has various unevenness. This changes the surface-lens distance when scanning neighboring locations. These differences in distance can lead to individual molecules leaving the focal plane and thus avoiding detection.
Aus diesem Grund ist es wichtig, dass beim Abscannen der Oberfläche eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition erreicht wird.For this reason, it is important that when scanning the surface, a reproducible adjustment of the focal plane is achieved at every lens position.
Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar einzustellen. Beispielsweise kann folgende Methode angewendet werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer Fluoreszenz führen kann, wird auf die Oberfläche ein Marker aufgebracht, der zur Einstellung der Fokusebene dient. Danach erfolgt die Detektion der Signale einzelner Moleküle. Der Marker kann beliebiger Natur sein (z.B. Farbstoff oder Muster), darf aber die Detektion und die Reaktion nicht beeinträchtigen. c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF.There are various ways to reproducibly adjust the focus level. For example, the following method can be used: Since the excitation of individual molecules can lead to the extinction of their fluorescence, a marker is applied to the surface, which serves to adjust the focal plane. The signals of individual molecules are then detected. The marker can be of any nature (eg dye or pattern), but must not interfere with the detection and the reaction. c) Detection of the signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective NSKF.
Das mit Hilfe des Detektionssystems erzeugte zweidimensionale Bild der Reaktionsoberfläche enthält die Signalinformationen von in die NSKFs eingebauten NT*s . Diese müssen vor der weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit geeigneten Methoden extrahiert werden. Die dazu notwendigen Algorithmen zur Skalierung, Transformation und Filterung der Bildinformationen zählen zum Standardrepertoir der digitalen Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der Digitalen Bildverarbeitung und Mustererkennung" . Hanser-Verlag, München, Wien, 1995; Galbiati L.J. "Machine vision and digital image processing fundamentals" . Prentice Hall, Englewood Cliffs, New Jersey, 1990) . Die Signalextraktion erfolgt vorzugsweise über ein Grauwertbild, das die Helligkeitsverteilung der Reaktionsoberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei der Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst für jedes verwendete fluoreszenzmarkierte Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild erzeugt werden. Dafür können prinzipiell 2 Verfahren angewendet werden:The two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information from NT * s built into the NSKFs. Before further processing, these must be extracted from the total amount of image information using suitable methods. The algorithms required for scaling, transforming and filtering the image information are part of the standard repertoire of digital image processing and pattern recognition (Haberäcker P. "Practice of digital image processing and pattern recognition". Hanser-Verlag, Munich, Vienna, 1995; Galbiati LJ "Machine vision and digital image processing fundamentals ". Prentice Hall, Englewood Cliffs, New Jersey, 1990). The signal extraction is preferably carried out via a gray value image, which depicts the brightness distribution of the reaction surface for the respective fluorescence channel. If several nucleotides with different fluorescent dyes are used in the sequencing reaction, a separate gray value image can first be generated for each fluorescence-labeled nucleotide (A, T, C, G or U). In principle, two methods can be used for this:
1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.1. A gray value image is generated for each fluorescence channel by using suitable filters (Zeiss filter sets).
2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt : GBN= (s(x,y)) einkanaliges Grauwertbild N={l, ... ,Anzahl der Fluoreszenzkanäle} .2. The relevant color channels are extracted from a recorded multichannel color image with the aid of a suitable algorithm by an image processing program and are individually processed further as a gray-scale image. A channel-specific color threshold algorithm is used for channel extraction. Individual gray value images 1 to N are thus initially created from a multi-channel color image. These images are defined as follows: GB N = (s (x, y)) single-channel gray value image N = {l, ..., number of fluorescence channels}.
M={θ, 1, ... , 255} GrauwertmengeM = {θ, 1, ..., 255} gray value set
S=(s(x,y)) Bildmatrix des Grauwertbildes x=0, 1, ... ,L-1 Bildzeilen y=0, 1, ... ,R-1 BildspaltenS = (s (x, y)) image matrix of the gray value image x = 0, 1, ..., L-1 image lines y = 0, 1, ..., R-1 image columns
(x,y) Ortskoordinaten eines Bildpunktes s(x,y)e M Grauwert des Bildpunktes.(x, y) location coordinates of a pixel s (x, y) e M gray value of the pixel.
Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante Bildinformation extrahiert. Ein solches Programm sollte folgende Arbeitsschritte realisieren:The relevant image information is then extracted from this amount of data by a suitable program. Such a program should implement the following steps:
Für GBX bis GBN durchführen:For GB X to GB N :
I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.I. Preprocessing of the image, for example, if necessary, reducing the image noise caused by the digitization of the image information, for example by gray value smoothing.
II. Prüfung jedes Bildpunkt (x,y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwert- verfahren bis hin zur Verwendung neuronaler Netze.II. Checking each pixel (x, y) of the gray-scale image as to whether this point fulfills the properties of a fluorescence point in connection with the immediate and further distant neighboring pixels surrounding it. These properties depend, among other things, on the detection equipment used and the resolution of the gray-scale image. For example, you can display a typical distribution pattern of brightness intensity values over a matrix surrounding the pixel. The image segmentation methods that can be used for this range from simple threshold value methods to the use of neural networks.
Erfüllt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein Vergleich mit den Koordinaten von in bisher durchgeführten Sequenzierungszyklen identifizierten NSKFs. Bei einer Übereinstimmung erfolgt die Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem NSKF. Signale mit nicht übereinstimmenden Koordinaten werden als Hintergrundsignale bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.If a pixel (x, y) fulfills these requirements, then a comparison with the coordinates of NSKFs identified in previous sequencing cycles follows. If there is a match, the signal is assigned to the nucleotide resulting from the respective fluorescence channel NACF. Signals with mismatched coordinates are evaluated as background signals and rejected. The signals can be analyzed in parallel with the scanning process.
In einer beispielhaften Ausführung wurde ein 8-Bit-Grauwertbild mit einer Auflösung von 1317 x 1035 Pixel verwendet. Um die durch die Digitalisierung entstandenen Veränderungen am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamtbildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit dem größten Helligkeitswert und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte) , dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes gewertet .In an exemplary embodiment, an 8-bit gray value image with a resolution of 1317 x 1035 pixels was used. In order to reduce the changes in the image caused by digitization, the overall image was first preprocessed: the average value of the brightness of its 8 neighbors was assigned to each pixel. With the selected resolution, this results in a typical pattern for a fluorescence dot of a central pixel with the greatest brightness value and neighboring pixels with brightness decreasing on all sides. If a pixel met these criteria and the centrifugal drop in brightness exceeded a certain threshold value (to exclude fluorescence spots that were too weak), this central pixel was evaluated as the coordinate of a fluorescence spot.
d) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert .d) Moving the lens to the next position on the surface. After detecting the signals of individual molecules, the lens is positioned over another position on the surface.
Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der X, Y-Position, der Einstellung der Fokusebene und mit der Detektion einzelner Moleküle bei jeder neuen Objektivposition gemacht werden. Diese Schritte können durch einen Computer gesteuert werden.Overall, for example, a sequence of recordings can be made with the control of the X, Y position, the adjustment of the focal plane and with the detection of individual molecules at each new lens position. These steps can be controlled by a computer.
4.7 Zeitlicher Ablauf der Verfahrensschritte4.7 Timing of the procedural steps
Der Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet, kann man eine optimale Leistung der Apparatur erreichen. In einer bevorzugten Ausführung wird die Reaktion auf zwei getrennten Oberflächen durchgeführt.The scanning process and the biochemical reaction take a certain amount of time. If you switch these processes one after the other, you can achieve an optimal performance of the equipment. In a preferred embodiment, the response to performed two separate surfaces.
Als Beispiel kann eine Oberfläche mit gebundenen NSKF-Primer- Komplexen in 2 räumlich isolierte Teile getrennt werden, so dass Reaktionen auf diesen beiden Teilen unabhängig voneinander ablaufen können. In einem anderen Beispiel können NSKFs auch von vornherein auf 2 getrennten Oberflächen immobilisiert werden.As an example, a surface with bound NSKF primer complexes can be separated into two spatially isolated parts, so that reactions on these two parts can take place independently of one another. In another example, NSKFs can also be immobilized on two separate surfaces from the outset.
Danach wird die Reaktion gestartet. Das Prinzip dabei ist, dass während auf einem Teil der Oberfläche die Reaktions- und Waschschritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse erreichen und die Geschwindigkeit der Sequenzierung steigern.The reaction is then started. The principle is that while the reaction and washing steps take place on part of the surface, the second part is scanned. This enables the analysis to run continuously and the speed of sequencing to be increased.
Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich limitierender Schritt auftritt, d.h. die Detektion der Signale auf der Oberfläche schneller als die Reaktions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.The number of surfaces on which the reaction takes place can also be greater than 2. This makes sense if the reaction occurs as a time-limiting step, i.e. the detection of the signals on the surface is faster than the reaction and washing steps. In order to adapt the total duration of the reaction to the detection duration, each individual step of the reaction can take place on a single surface with a time delay compared to the next surface.
Die Erfindung wird nachfolgend anhand von Beispielen verdeutlicht. The invention is illustrated below using examples.
BeispieleExamples
Beispiel 1:Example 1:
Sequenzanalyse mit 4 markierten NTs* Sequence analysis with 4 marked NTs *
Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- farbstoffen markiert .In a preferred embodiment of the invention, all four NTs * used in the reaction are labeled with fluorescent dyes.
1A. Rekonstruktion der ursprünglichen Sequenzen nach dem Schrotschuß-Prinzip ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J. Comput .Biol . 1994 v.l S.257) . (Dieses Prinzip ist insbesondere bei der Analyse neuer, unbekannter Sequenzen geeignet . )1A. Reconstruction of the original sequences according to the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p. 868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257). (This principle is particularly useful when analyzing new, unknown sequences.)
1A-1Sequenzierung eines langen DNA-Stücks1A-1 sequencing of a long piece of DNA
Im folgenden soll anhand der Sequenzierung eines 1Mb langen DNA-Stückes schematisch die Sequenzierung langer Nukleinsäureketten dargestellt werden (Fig. 1) . Der Sequenzierung liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al. NAR 1995 v.23 S.4992, Miller et al . J.Comput .Biol . 1994 v.l S.257). Das zu analysierende Material wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird. Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen. Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert . Die nicht gebundenen DNA- Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktions- Oberfläche durchgeführt. Zur Rekonstruktion einer 1 Mb langen DNA-Sequenz sollten die Sequenzen von NSKFs vorzugsweise länger als 300 NTs sein, durchschnittlich ca. 400 bp. Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 400 Zyklen zur Sequenzierung notwendig.In the following, the sequencing of long nucleic acid chains will be shown schematically on the basis of the sequencing of a 1Mb piece of DNA (FIG. 1). The sequencing is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v .33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J.Comput. Biol. 1994 vl p.257). The material to be analyzed is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length. Each fragment is then provided with a primer binding site and a primer. This mixture of different DNA fragments is now fixed on a flat surface. The unbound DNA fragments are removed by a washing step. The sequencing reaction is then carried out on the entire reaction Surface performed. To reconstruct a 1 Mb long DNA sequence, the sequences of NSKFs should preferably be longer than 300 NTs, on average approx. 400 bp. Since only one marked NT * is installed per cycle, at least 400 cycles are required for sequencing.
Insgesamt ist zur Rekonstruktion der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d.h. 10 bis 100 Mb. Bei einer durchschnittlichen Sequenzlänge von ca. 400 bp pro NSKF benötigt man entsprechend 25.000 bis 250.000 DNA- Fragmente, um mehr als 99,995% der Gesamtsequenz abzudecken .Overall, approximately 10 to 100 times the amount of raw sequences is required to reconstruct the original sequence, i.e. 10 to 100 Mb. With an average sequence length of approx. 400 bp per NSKF, 25,000 to 250,000 DNA fragments are required in order to cover more than 99.995% of the total sequence.
Die ermittelten NSKF-Sequenzen stellen eine Population von überlappenden Teilsequenzen dar, die sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen lassen ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press , Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J . Comput . Biol . 1994 v.l S.257).The NSKF sequences determined represent a population of overlapping partial sequences which can be combined with commercially available programs to form the overall sequence of the NSK ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p.868, Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl S. 257).
A-2Sequenzierung der Genprodukte am Beispiel der cDNA-Sequen- zierungA-2 sequencing of gene products using the example of cDNA sequencing
In einer bevorzugten Ausführungsform können statt einer Sequenz mehrere Sequenzen in einem Ansatz analysiert werden. Die ursprünglichen Sequenzen können aus den gewonnen Rohdaten z.B. nach dem Schrotschuß-Prinzip rekonstruiert werden.In a preferred embodiment, several sequences can be analyzed in one approach instead of one sequence. The original sequences can be extracted from the raw data e.g. be reconstructed according to the shotgun principle.
Zunächst werden NSKFs erzeugt . Man kann z.B. mRNA in eine doppelsträngige cDNA überführen und diese cDNA mit Ultraschall fragmentieren. Anschließend werden diese NSKFs mit einer Primerbindungsstelle versehen, denaturiert, immobilisiert und mit einem Primer hybridisiert. Zu beachten ist bei dieser Variante der Probenvorbereitung, dass die cDNA-Moleküle unvollständige mRNA-Sequenzen darstellen können (Method in Enzymology 1999, v.303, S.19 und andere Artikel in diesem Band, "cDNA library protocols" 1997 Humana Press) .First, NSKFs are created. For example, one can convert mRNA into a double-stranded cDNA and fragment this cDNA with ultrasound. These NSKFs are then provided with a primer binding site, denatured, immobilized and hybridized with a primer. It should be noted with this variant of the sample preparation that the cDNA molecules can represent incomplete mRNA sequences (Method in Enzymology 1999, v.303, p.19 and other articles in this volume, "cDNA library protocols" 1997 Humana Press).
Eine andere Möglichkeit bei der Generierung einzelsträngiger NSKFs von mRNA besteht in der reversen Transkription der mRNA mit randomisierten Primern. Dabei werden viele relativ kurze antisense DNA-Fragmente gebildet (Zhang-J et al. Biochem.J. 1999 v.337 S.231, Ledbetter et al . J.Biol.Chem. 1994 v.269 S.31544, Rolls et al. Anal.Biochem. 1993 v.208 S.264, Decraene et al . Biotechniques 1999 v.27 S.962). Diese Fragmente können anschließend mit einer Primerbindungstelle versehen werden (s.o). Weitere Schritte entsprechen oben beschriebenen Vorgängen. Mit dieser Methode können komplette mRNA- Sequenzen (vom 5'- bis zum 3 ' -Ende) analysiert werden, da die randomisierten Primer über die gesamte Länge der mRNA binden .Another possibility for the generation of single-stranded NSKFs from mRNA is the reverse transcription of the mRNA with randomized primers. Many relatively short antisense DNA fragments are formed (Zhang-J et al. Biochem. J. 1999 v.337 p.231, Ledbetter et al. J.Biol.Chem. 1994 v.269 p.31544, Rolls et al Anal.Biochem. 1993 v.208 p.264, Decraene et al. Biotechniques 1999 v.27 p.962). These fragments can then be provided with a primer binding site (see above). Further steps correspond to the processes described above. With this method, complete mRNA sequences (from the 5 'to the 3' end) can be analyzed, since the randomized primers bind over the entire length of the mRNA.
Immobilisierte NSKFs werden mit einer der oben angeführten Ausführungsformen der Sequenzierung analysiert. Da mRNA- Sequenzen wesentlich weniger repetitive Sequenzen aufweisen als z.B. genomische DNA, kann die Anzahl der detektierten Signale der eingebauten NTs* von einem NSKF geringer als 300 sein und liegt vorzugsweise zwischen 20 und 1000. Die Anzahl der NSKFs, die analysiert werden müssen, errechnet sich nach denselben Prinzipien wie bei einer Schrotschuß-Rekonstruktion einer langen Sequenz .Immobilized NSKFs are analyzed using one of the sequencing embodiments listed above. Since mRNA sequences have significantly fewer repetitive sequences than, for example, genomic DNA, the number of signals detected by the built-in NTs * from an NSKF can be less than 300 and is preferably between 20 and 1000. The number of NSKFs that need to be calculated is calculated following the same principles as a shot-shot reconstruction of a long sequence.
Aus NSKF-Sequenzen werden nach den Prinzipien des Schrotschuß-Verfahrens die ursprünglichen Gensequenzen rekonstruiert .The original gene sequences are reconstructed from NSKF sequences according to the principles of the shotgun method.
Diese Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs ohne vorherige Klonierung.This method allows the sequencing of many mRNAs without prior cloning.
B . Analyse von SequenzvariantenB. Analysis of sequence variants
Die Bestätigung einer bereits bekannten Sequenz oder der Nachweis von Varianten dieser Sequenz stellt sehr viel geringere Ansprüche an die Länge und Redundanz der ermittelten NSKF-Sequenzen. Auch die Sequenzbearbeitung ist in diesem Fall einfacher. Die Vollsequenz braucht nicht neu rekonstruiert zu werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus zugrunde liegen ( "Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .Confirming a previously known sequence or detecting variants of this sequence places far less demands on the length and redundancy of the NSKF sequences determined. Sequence editing is also easier in this case. The full sequence does not need to be reconstructed. Rather, the NSKF sequences are assigned to the full sequence using a commercially available program and any deviations are detected. Such a program can e.g. BLAST or FASTA algorithm are based ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Die zu analysierende Sequenz wird mit einer der oben genannten Methoden in NSKFs überführt . Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequenziert, wobei man sowohl einen einheitlichen Primer und eine einheitlihe Primerbindungsstelle als auch unterschiedliche, sequenzspezifische Primer und natürliche, in der zu untersuchenden Gesamtsequenz vorkommendeThe sequence to be analyzed is converted into NSKFs using one of the methods mentioned above. These NSKFs are sequenced using the method according to the invention, wherein both a uniform primer and a uniform primer binding site as well as different, sequence-specific primers and natural ones which occur in the overall sequence to be investigated
Primerbindngsstellen verwenden kann. Anschließend werden die ermittelten Sequenzen von NSKFs nicht nach dem Schrotschuß-Verfahren zusammengestzt, sondern mit der Referenz- sequenz verglichen und auf diese Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei kann es sich um genomische oder cDNA-Sequenzen handeln.Can use primer binding sites. The determined sequences of NSKFs are then not assembled using the shotgun method, but are compared with the reference sequence and in this way assigned to their positions in the full sequence. This can be genomic or cDNA sequences.
Im Gegensatz zu einer Rekonstruktion nach dem Schrotschuß- Verfahren braucht man für die Analyse einer Sequenzvariante erheblich weniger Rohsequenzdaten. So kann die 5- bis 10- fache Rohsequenzmenge ausreichend für die Wiederherstellung einer neuen Variante einer Vollsequenz sein. Mit dem Schrotschuß-Verfahren wird für eine Wiederherstellung ' eine 10- bis 100-fache Menge an Rohsequenzen benötigt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al . Academic Press, Huang et al . Genom Res. 1999 v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al . NAR 1995 v.23 S.4992, Miller et al . J. Comput .Biol . 1994 v.l S.257) .In contrast to a shotgun reconstruction, the analysis of a sequence variant requires considerably less raw sequence data. For example, 5 to 10 times the raw sequence quantity can be sufficient to restore a new variant of a full sequence. With the shotgun process is for a Recovery ' requires a 10 to 100-fold amount of raw sequences ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.9 p. 868 , Huang Genomics 1996 v.33 p.21, Bonfield et al. NAR 1995 v.23 p.4992, Miller et al. J. Comput. Biol. 1994 vl p.257).
Die Länge der ermittelten NSKF-Sequenzen soll für eine eindeutige Zuordnung zu einer bestimmten Position in der Referenzsequenz ausreichend sein, so können z.B bereits Sequenzen mit einer Länge von 20 NTs (z.B. aus nicht repetitiven Abschnitten im menschlichen Genom) eindeutig identifiziert werden. Für die Vergleichsanalyse der repetitiven Abschnitte werden längere Sequenzen benötigt. Die genaue Länge der Sequenzen hängt dabei von der Aufgabenstellung ab. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs.The length of the NSKF sequences determined should be sufficient for an unambiguous assignment to a specific position in the reference sequence, for example sequences with a length of 20 NTs (e.g. from non-repetitive sections in the human genome) can be clearly identified. Longer sequences are required for the comparative analysis of the repetitive sections. The exact length of the sequences depends on the task. The length of the NSKF sequences determined is preferably more than 20 NTs when analyzing non-repetitive sections. For the analysis of the repetitive sections, it is preferably over 500 NTs.
Die Zielsetzungen bei der Sequenzierung neuer Varianten einer bereits bekannten Vollsequenz können sehr unterschiedlich sein. Meist wird ein Vergleich der neu ermittelten Sequenz mit der bekannten Vollsequenz/Referenzsequenz angestrebt. Dabei können die beiden Sequenzen aus evolutionär unterschiedlich weit auseinanderliegenden Spezies stammen. Verschiedene Parameter der Zusammensetzung dieser beiden Sequenzen können verglichen werden. Als Beispiele für eine solche Analyse dienen: Mutations- oder Polymorphismusanalysen und die Analyse von alternativ gespleißten Genprodukten.The objectives when sequencing new variants of an already known full sequence can be very different. A comparison of the newly determined sequence with the known full sequence / reference sequence is usually sought. The two sequences can originate from species that are evolutionarily different from one another. Different parameters of the composition of these two sequences can be compared. Examples of such an analysis are: mutation or polymorphism analyzes and the analysis of alternative spliced gene products.
Nachfolgend soll schematisch und beispielhaft ein Vergleich der zu untersuchenden Sequenz mit einer Referenzsequenz ohne vorherige Rekonstruktion der zu analysierenden Sequenz betrachtet werden. Ein solcher Vergleich kann z.'B. zur Mutations- oder SNP-Analyse dienen.In the following, a comparison of the sequence to be examined with a reference sequence without prior reconstruction of the sequence to be analyzed is to be considered schematically and as an example. Such a Comparison can e.g. ' B. serve for mutation or SNP analysis.
B-1B-1
Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden unter Verwendung einheitlicher Primer mit dem erfindungsgemäßen Verfahren sequenziert. Die ermittelten Sequenzen von jedem einzelnen NSKF werden direkt mit der Referenzsequenz verglichen. Die Referenzsequenz dient dabei als Grundlage für die Zuordnung ermittelter NSKF- Sequenzen, so dass die aufwendige Rekonstruktion nach dem Schrotschuß-Verfahren entfällt . Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht-repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs. Die Anzahl der zu analysierenden NSKFs richtet sich dabei nach der Gesamtlänge der zu untersuchenden Sequenz, der durchschnittlichen Länge der NSKF-Sequenzen und der notwendigen Genauigkeit der Sequenzierung. Bei einer durchschnittlichen Länge der ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlänge der zu untersuchenden Sequenz von 1 Mb und einer Genauigkeit, die der Rohsequenzermittlung entspricht (d.h. jede Stelle soll möglichst nur einmal sequenziert werden) benötigt man z.B. die ca. 5-fache Menge an Rohsequenzen, d.h. 5 Mb, weil die Verteilung der NSKFs über die Gesamtsequenz zufällig erfolgt. Insgesamt müssen 50.000 NSKFs analysiert werden, um mehr als 99% der Gesamtstrecke abzudecken.A long sequence to be analyzed, e.g. 1 Mb, is shared in NSKFs using one of the above methods. These NSKFs are sequenced using uniform primers using the method according to the invention. The sequences determined from each individual NSKF are compared directly with the reference sequence. The reference sequence serves as the basis for the assignment of determined NSKF sequences, so that the time-consuming reconstruction using the shotgun method is not necessary. The length of the NSKF sequences determined is preferably more than 20 NTs when analyzing non-repetitive sections. For the analysis of the repetitive sections, it is preferably over 500 NTs. The number of NSKFs to be analyzed depends on the total length of the sequence to be examined, the average length of the NSKF sequences and the necessary accuracy of the sequencing. With an average length of the determined NSKF sequence of 100 NTs, a total length of the sequence to be examined of 1 Mb and an accuracy that corresponds to the raw sequence determination (i.e. each location should be sequenced only once if possible), e.g. approx. 5 times the amount of raw sequences, i.e. 5 Mb because the NSKFs are randomly distributed over the entire sequence. A total of 50,000 NSKFs must be analyzed to cover more than 99% of the total route.
Anschließend werden die ermittelten NSKF-Sequenzen mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus zugrunde liegen ( "Introduction to computational Biolögy" 1995 M.S. Waterman Chapman & Hall)The determined NSKF sequences are then assigned to the full sequence using a commercially available program and any deviations are detected. Such a program can be based on, for example, BLAST or FASTA algorithm ("Introduction to computational Biolögy "1995 MS Waterman Chapman & Hall)
Beispiel 2 :Example 2:
Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs (2NTs* / 2NTs-Methode) .Sequence analysis with 2 marked NTs * and 2 unmarked NTs (2NTs * / 2NTs method).
In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs eingesetzt .In another embodiment, 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
Diese Methode eignet sich besonders zur Analyse der Seguenzva- rianten (z.B. SNP- oder Mutationsanalyse) und setzt die Kenntnis einer Referenzsequenz voraus. Dabei wird die Vollsequenz nicht rekonstruiert, sondern die ermittelten Sequenzen werden mit Hilfe eines Programms der Referenzsequenz zugeordnet und eventuelle Abweichungen registriert. Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .This method is particularly suitable for analyzing the sequence variants (e.g. SNP or mutation analysis) and requires knowledge of a reference sequence. The full sequence is not reconstructed, but the determined sequences are assigned to the reference sequence using a program and any deviations are registered. Such a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Diese Ausführungsform beruht auf dem Prinzip, dass eine Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz verglichen und einer bestimmten Position zugeordnet, z.B.:This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence. The determined sequence is compared with the reference sequence and assigned to a specific position, for example:
ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind markiert)ACCAAAACACCC - determined sequence (dCTP * and dATP * are marked)
ATCATCGTTCGAAATATCGATCGCCTGATGCC - ReferenzsequenzATCATCGTTCGAAATATCGATCGCCTGATGCC - reference sequence
A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz)A-C C-AAA-A-C-A-C-CC (assigned determined sequence)
ATCATCGTTCGAAATATCGATCGCCTGATGCC (Referenzsequenz) Die unbekannte, zu analysierende Variante der Referenzsequenz wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK wird in NSKFs überführt, diese werden mit PBS ligiert, anschließend mit einem Primer hybridisiert und auf Reaktionsoberfläche immobilisiert) . Auf diese Weise vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. Man erhält NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen mehr als 40 NT*s . Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 40 detektierten NTs* beträgt die Gesamtlänge z,B. durchschnittlich 80 NTs) .ATCATCGTTCGAAATATCGATCGCCTGATGCC (reference sequence) The unknown variant of the reference sequence to be analyzed is prepared for sequencing as described above (NSK is converted into NSKFs, these are ligated with PBS, then hybridized with a primer and immobilized on the reaction surface). NSKFs prepared in this way are sequenced using the 2NTs * / 2NTs method. NSKF sequences are obtained, each NSKF sequence being a sequence of 2NTs * . In order to enable the determined sequence to be clearly assigned to a known reference sequence, this sequence must be long enough. The length of the NSKF sequences determined is preferably more than 40 NT * s. Since 2 marked NTs * represent only part of the sequence, the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 40 detected NTs * , the total length is z, e.g. 80 NTs on average).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt . Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d.h. die Termination ausschließlich bei Verfügbarkeit modifizierter NTs* auftritt, müssen unmodifizierte NTs in einem zusätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, dass die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.4 nucleotides are required to synthesize a complementary strand. Since the NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgendermaßen aussehen:A cycle in this embodiment may look as follows, for example:
a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten NSKFs b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind c) Waschen d) Detektion der Signale von einzelnen, modifizierten und in die den NSKFs komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden f) Waschen g) Zugabe von 2 unmodifizierten NTs und Polymerasen h) Waschen.a) adding a solution with modified NTs * and polymerases to the surface with the NSKFs provided b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by an NT c) washing d) Detection of the signals from individual, modified NTs * molecules built into the newly synthesized strands complementary to the NSKFs e) removal of the label and the terminating group in the built-in nucleotides f) washing g) addition of 2 unmodified NTs and polymerases h) washing ,
Diese 2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP-Analyse einer genomischen Strecke eines Gens oder für doppelsträngige cDNA-Analyse . Ihr liegen folgende Prinzipien zugrunde :This 2NT * s / 2NTs method is suitable, for example, for the SNP analysis of a genomic stretch of a gene or for double-stranded cDNA analysis. It is based on the following principles:
1) Die genetische Information in jedem der beiden komplementären DNA-Stränge ist identisch, so dass fehlende Informationen in einem Strang durch die Information aus dem anderen Strang vervollständingt werden können.1) The genetic information in each of the two complementary DNA strands is identical, so that missing information in one strand can be completed by the information from the other strand.
2) Durch bestimmte Paarkombinationen markierter NTs* kann man mit nur 2 NTs* die komplette Information aus einer doppel- strängigen DNA erhalten. Zulässige Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*; C*T*/C*U*; G*T*/G*U* . Bevorzugt wird die Kombination C* und U* .2) By combining certain pairs of labeled NTs * , you can obtain complete information from a double-stranded DNA with only 2 NTs * . Permissible combinations of NT * s in this embodiment are: A * C * ; A * G * ; C * T * / C * U * ; G * T * / G * U * . The combination C * and U * is preferred.
3) Als Grundlage der Analyse dient eine bereits bekannte Referenzsequenz .3) An already known reference sequence serves as the basis for the analysis.
4) Die NSKFs stammen von beiden Strängen der zu analysierenden NSK und • die ermittelten NSKF-Sequenzen decken die gesamte Länge der zu analysierenden Sequenz ab.4) The NSKFs come from both strands of the NSK to be analyzed and • the NSKF sequences determined cover the entire length of the sequence to be analyzed.
Am folgenden Beispiel wird erklärt, wie die Information aus einem doppelsträngigen DNA-Fragment mit nur 2 markierten NTs* gewonnen wird und wie die Unterschiede zur ursprünglichen oder nicht mutierten Sequenz (Referenzsequenz / Vergleichsequenz) festgestellt werden können. Sequenzen unter (1) und (2) sind bis auf eine Stelle identisch (unterstrichen) . A* und C* sind markiert . 1) zu prüfende Sequenz:The following example explains how the information is obtained from a double-stranded DNA fragment with only 2 labeled NTs * and how the differences from the original or non-mutated sequence (reference sequence / comparison sequence) can be determined. Sequences under (1) and (2) are identical except for one position (underlined). A * and C * are marked. 1) Sequence to be checked:
Die zu prüfende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, so dass eine Population an NSKF-Sequenzen (ermittelte NSKF-Sequenzen (n) ) entsteht. Diese ermittelten NSKF-Sequenzen enthalten Information von jedem Strang:The sequence to be checked is sequenced using the 2NT * s / 2NTs method, so that a population of NSKF sequences (determined NSKF sequences (n)) is formed. The NSKF sequences determined contain information from each strand:
5'A-C C-AAA-A-C-A-C-CC3' - ermittelte NSKF-Sequenz (i)5'A-C C-AAA-A-C-A-C-CC3 '- NSKF sequence determined (i)
5 ' ATCGTTCGAAATATCGATCGCCTG3 ' 3 ' TAGCAAGCTTTATAGCTAGCGGAC5 ' 3' A-CAA-C---A-A-C-A-C---C5' - ermittelte NSKF-Sequenz (i+1)5 'ATCGTTCGAAATATCGATCGCCTG3' 3 'TAGCAAGCTTTATAGCTAGCGGAC5' 3 'A-CAA-C --- A-A-C-A-C --- C5' - determined NSKF sequence (i + 1)
2) Vergleichsequenz:2) Comparison sequence:
Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) erforderlich:A comparison sequence (reference sequence) is required for analysis:
5 ' ATTGTTCGAAATATCGATCGCCTG3 ' 3 ' TAACAAGCTTTATAGCTAGCGGAC5 '5 'ATTGTTCGAAATATCGATCGCCTG3' 3 'TAACAAGCTTTATAGCTAGCGGAC5'
3) Vergleichsequenz mit angepaßten ermittelten NSKF-Sequenzen:3) Comparison sequence with adapted NSKF sequences determined:
Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen bestimmten Stellen in der Vergleichsequenz zugeordnet und eventuelle Abweichungen detektiert :With the help of a program, determined NSKF sequences are assigned to specific points in the comparison sequence and possible deviations are detected:
5'A-C C-AAA-A-C-A-C-CC3' - ermittelte NSKF-Sequenz (i)5'A-C C-AAA-A-C-A-C-CC3 '- NSKF sequence determined (i)
5 'ATTGTTCGAAATATCGATCGCCTG3 ' 3 ' TAACAAGCTTTATAGCTAGCGGAC5 ' 3' A-CAA-C A-A-C-A-C---C5' - ermittelte NSKF-Sequenz (i+1)5 'ATTGTTCGAAATATCGATCGCCTG3' 3 'TAACAAGCTTTATAGCTAGCGGAC5' 3 'A-CAA-C A-A-C-A-C --- C5' - NSKF sequence determined (i + 1)
1t (Einzelnukleotidmutation)1t (single nucleotide mutation)
Mit dieser Ausführungsform kann man eine doppelsträngige Nukleinsäure auf SNP oder Mutationen untersuchen. Dabei werden die ermittelten NSKF-Sequenzen mit einer Referenzsequenz verglichen. Die Grundregeln des Vergleichs einer Teilsequenz und einer kompletten Sequenz bei der Analyse mit nur 2 markierten NTs unterscheiden sich nicht prinzipiell von denen, die bei dem Vergleich der Sequenzen anhand aller 4 markierten NTs* gelten. Näheres s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse mit 4NTs* (Beispiel 1B) .With this embodiment, a double-stranded nucleic acid can be examined for SNP or mutations. The NSKF sequences determined are compared with a reference sequence compared. The basic rules of comparing a partial sequence and a complete sequence in the analysis with only 2 marked NTs do not differ fundamentally from those that apply when comparing the sequences using all 4 marked NTs * . For more information, see Sequence comparison in mutation analysis and SNP analysis with 4NTs * (Example 1B).
Beispiel 3 : Analyse der GenexpressionExample 3: Analysis of gene expression
Die Grundprinzipien der Sequenzierungsreaktion bei der Genexpressionsanalyse entsprechen denen der Sequenzierungsreaktion langer NSKs (Fig. 7) . Die Grundprinzipien zur Durchführung eines Reaktionszyklus (die Wahl der NT*-Struktur, der Polymerase, der Reaktionsbedingungen für die NT*-Einbaureaktion und die Abspaltungsreaktion) , sowie zur Detektion der Signale von eingebauten NT*, entsprechen denen im Verfahren zur Sequenzierung langer NSKs. Die wesentlichen Unterschiede zwischen beiden Verfahren liegen in der Materialauswahl und - Vorbereitung und in der Verarbeitung der gewonnenen Daten.The basic principles of the sequencing reaction in gene expression analysis correspond to those of the sequencing reaction of long NSKs (Fig. 7). The basic principles for carrying out a reaction cycle (the choice of the NT * structure, the polymerase, the reaction conditions for the NT * incorporation reaction and the cleavage reaction) and for the detection of the signals from built-in NT * correspond to those in the process for sequencing long NSKs. The main differences between the two methods lie in the selection and preparation of materials and the processing of the data obtained.
Auswahl des Materials :Choice of material:
Genprodukte können von verschiedenen biologischen Objekten stammen, so z.B. von einzelnen Zellen, Zellpopulationen, einem Gewebe oder von kompletten Organismen. Auch biologische Flüssigkeiten wie Blut, Sputum oder Liquor können als Quelle der Genprodukte dienen. Die Methoden zur Gewinnung der Genprodukte aus den verschiedenen biologischen Objekten sind bespielsweise folgenden Literaturquellen zu entnehmen: "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc..Gene products can come from various biological objects, e.g. of individual cells, cell populations, a tissue or of entire organisms. Biological fluids such as blood, sputum or cerebrospinal fluid can also serve as a source of the gene products. The methods for obtaining the gene products from the various biological objects can be found, for example, in the following literature sources: "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I. G. Cowell, Humana Press Inc.
Es kann sowohl die Gesamtheit der isolierten Genprodukte als auch ein durch eine Vorselektion ausgewählter Teil davon in die Sequenzierungsreaktion eingesetzt werden. Durch Vorselektion kann man die Menge der zu analysierenden Genprodukte reduzieren'. Die Vorselektion kann beispielsweise durch molekularbiologische Verfahren wie z.B. PCR- Amplifikation, Gel-Auftrennung oder Hybridisierung mit anderen Nukleinsäureketten erfolgen ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.)Both the entirety of the gene products isolated and a part thereof selected by preselection can be used in the sequencing reaction. By preselection one can determine the amount of the to be analyzed Reduce gene products ' . The preselection can be carried out, for example, by means of molecular biological methods such as, for example, PCR amplification, gel separation or hybridization with other nucleic acid chains ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.)
Vorzugsweise wird die Gesamtheit der Genprodukte als Ausgangsmaterial gewählt .The entirety of the gene products is preferably selected as the starting material.
Vorbereitung des Materials :Preparation of the material:
Ziel der Vorbereitung des Materials ist es, aus dem Ausgangs- material an die Oberfläche gebundene, extensionsfähige Genprodukt-Primer-Komplexe zu bilden. Wobei pro Genprodukt maximal nur ein Primer binden sollte.The aim of the preparation of the material is to form extensible gene product-primer complexes from the starting material that are bound to the surface. Whereby only a maximum of one primer should bind per gene product.
Primerbindungsstelle (PBS) : Jedes Genprodukt hat vorzugsweise nur eine Primerbindungsstelle .Priming site (PBS): Each gene product preferably has only one priming site.
Eine Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das Genprodukt ermöglichen soll .A primer binding site is a sequence section which is intended to enable selective binding of the primer to the gene product.
Als Primerbindungsstellen können Abschnitte in der Nukleinsäuresequenz dienen, die in den zu analysierenden Sequenzen natürlicherweise vorkommen (z.B. polyA-Strecken in mRNA) . Eine Primerbindungsstelle kann auch zusätzlich in das Genprodukt eingeführt werden (Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.).Sections in the nucleic acid sequence that naturally occur in the sequences to be analyzed can serve as primer binding sites (e.g. polyA stretches in mRNA). A primer binding site can also be introduced into the gene product (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory," Method in Enzymology "1999, v303," cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc. ).
Aus Gründen der Vereinfachung der Analyse kann es wichtig sein, dass eine möglichst einheitliche Primerbindungsstelle in allen Genprodukten vorhanden ist. Dann können Primer mit einheitlicher Struktur in die Reaktion eingesetzt werden. Die Zusammensetzung der Primerbindungsstelle ist nicht einge- schränkt. Ihre Länge beträgt vorzugsweise zwischen 10 und 100 NTs . Die Primerbindungsstelle kann eine funktioneile Gruppe tragen, beispielsweise zur Bindung des Genprodukts an die Oberfläche. Diese funktionelle Gruppe kann z.B. eine Biotin- oder Digoxigenin-Gruppe sein.In order to simplify the analysis, it may be important to have a primer binding site that is as uniform as possible in all gene products. Then primers with a uniform structure can be used in the reaction. The composition of the primer binding site is not limits. Their length is preferably between 10 and 100 NTs. The primer binding site can carry a functional group, for example to bind the gene product to the surface. This functional group can be, for example, a biotin or digoxigenin group.
Als Beispiel für die Einführung einer Primerbindungsstelle in die Genprodukte wird das Nukleotid-Tailing von antisense cDNA- Fragmenten beschrieben.The nucleotide tailing of antisense cDNA fragments is described as an example of the introduction of a primer binding site into the gene products.
Als erstes werden einzelsträngige cDNAs von mRNAs synthetisiert. Es resultiert eine Population an cDNA- Molekülen, die eine Kopie der mRNA-Population darstellen, sogenannte antisense-cDNA. (Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.) . Mit einer terminalen Deoxynucleotidyltransferase kann man mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate an das 3 ' -Ende dieser antisense cDNA anknüpfen, z.B. mehrere Adenosin-Monophosphate ((dA)n-Tail genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (dT) n-Primers, verwendet ( "Molecular cloning" 1989 J.Sambrook et al . Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, S.37-38) .First, single-stranded cDNAs are synthesized from mRNAs. The result is a population of cDNA molecules that represent a copy of the mRNA population, so-called antisense cDNA. (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory," Method in Enzymology "1999, v303," cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.). With a terminal deoxynucleotide transferase, one can do several ( for example between 10 and 20) attach nucleoside monophosphates to the 3 'end of this antisense cDNA, for example several adenosine monophosphates (called ((dA) n-tail). The resulting fragment is used to bind the primer, in this example one (dT ) n-primers used ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, pp. 37-38).
Primer für die Secruenzierungsreaktion: Dieser hat die Funktion, den Start an einer einzigen Stelle des Genprodukts zu ermöglichen. Vorzugsweise bindet er an die Primerbindungsstelle im Genprodukt. Die Zusammensetzung und die Länge des Primers sind nicht eingeschränkt . Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z.B. eine Verbindung der Genprodukt-Primer- Komlexe zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, dass der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht. Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine funktionelle Gruppe tragen, die beispielsweise zur Bindung des Primers an die Oberfläche dient, beispielsweise ist eine solche funktionelle Gruppe eine Biotingruppe (s. Abschnitt Immobilisierung) . Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z.B. mit dem DNA-Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Deutschland, erstellt werden.Primer for the secretion reaction: This has the function of enabling starting at a single point in the gene product. It preferably binds to the primer binding site in the gene product. The composition and the length of the primer are not restricted. In addition to the start function, the primer can also perform other functions, such as creating a connection between the gene product-primer complexes and the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase. The length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs. The primer can carry a functional group which is used, for example, to bind the primer to the surface, for example such a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing. The synthesis of such a primer can be carried out, for example, with the 380 A Applied Biosystems DNA synthesizer or can be created as a custom synthesis from a commercial provider, for example MWG-Biotech GmbH, Germany.
Es können auch unterschiedliche Primer verwendet werden, ein definierter Primersatz, oder ein Primergemisch.Different primers can also be used, a defined primer set, or a primer mixture.
Der Primer kann vor der Hybridisierung an die zu analysierenden Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden beispielsweise nach (McGall et al . US Patent 5412087, Barrett et al . US Patent 5482867, Mirzabekov et al . US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al . Science 1991 v.285 S.767, Timofeev et al . Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al . NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v.15 S.5373, Maskos et al . NAR 1992 v.20 S.1679).Before hybridization, the primer can be fixed to the fragments to be analyzed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 p.767, Timofeev et al. Nucleic Acid Research (NAR) 1996 , v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679).
Die Primer werden auf der Oberfläche in einer Dichte zwischen 10 bis 100 pro 100 μm2, 100 bis 10.000 pro 100 μm2, 10.000 bis 1.000.000 pro lOOμm2 oder größer als 1.000.000 pro 100 μm2 gebunden.The primers are on the surface at a density between 10 to 100 microns per 100 2, 100 to 10,000 per 100 micron 2, bound 10,000 to 1,000,000 per lOOμm 2 or greater than 1,000,000 per 100 microns. 2
Der Primer oder das Primergemisch wird mit Genprodukten unter Hybridisierungsbedingungen inkubiert, die ihn selektiv an die Primerbindungsstelle jedes Genprodukts binden lassen. Diese Primer-Hybridisierung (Annealing) kann vor (1) , während (2) oder nach (3) der Bindung der Genprodukte an die Oberfläche erfolgen. Falls Genprodükte als doppelsträngige Nukleinsäuren vorliegen, werden sie vor der Hybridisierung durch Hitze denaturiert ("Molecular cloning" 1989 J.Sambrook et al . Cold Spring Harbor Laborotary Press) . Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al . (NAR 1990 v.18 S.6409) berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet .The primer or mixture of primers is incubated with gene products under hybridization conditions that selectively bind it to the primer binding site of each gene product. This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the gene products to the surface respectively. If gene products are present as double-stranded nucleic acids, they are denatured by heat before hybridization ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press). The optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be done according to Rychlik et al. (NAR 1990 v.18 p.6409). In the following, these hybridization conditions are referred to as standardized hybridization conditions.
Falls das Ausgangsmaterial eine poly-A-Strecke oder eine poly- dA-Strecke aufweist (z.B. mRNA, sense cDNA oder antisense-cDNA mit (dA)n-Tail) kann man einen oligo-dT-Primer verwenden. Es kann allerdings auch ein Primergemisch bestehend aus 12 verschiedenen Primern mit folgender allgemeiner Struktur 5' (K)nMN3' verwendet werden. Wobei (n) zwischen 10 und 50 liegt, vorzugsweise zwischen 20 und 30. "K" steht für dT oder dU, "M" und "N" stehen jeweils für dA, dT oder dU, dC, dG ( z . B .5 "* -dTdTdTdTdTdTdTdTdTdT10dTdTdTdTdTdTdTdTdTdT2QdAdG-3 "* ) . Ein solches Primergemisch ermöglicht einen exakten Start der Sequenzierungsreaktion am Ende der polyA-Strecke oder der poly-dA-Strecke (geankerter Primer) .If the starting material has a poly-A stretch or a poly-dA stretch (for example mRNA, sense cDNA or antisense cDNA with (dA) n -Tail), an oligo-dT primer can be used. However, a primer mixture consisting of 12 different primers with the following general structure 5 '(K) n MN3' can also be used. Where (n) is between 10 and 50, preferably between 20 and 30. "K" stands for dT or dU, "M" and "N" each stand for dA, dT or dU, dC, dG (e.g. .5 " * -dTdTdTdTdTdTdTdTdTdT 10 dTdTdTdTdTdTdTdTdTdT 2Q dAdG-3 " * ). Such a primer mixture enables an exact start of the sequencing reaction at the end of the polyA segment or the poly-dA segment (anchored primer).
Fixierung von Genprodukt-Primer-Komplexen an die Oberfläche (Bindung bzw. Immobilisierung von Genprodukten) :Fixation of gene product-primer complexes to the surface (binding or immobilization of gene products):
Ziel der Fixierung (Bindung, Immobilisierung) ist es, Genprodukt-Primer-Komplexe auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, dass eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise durch Bindung des Primers (s.o.) oder des Genprodukts an die Oberfläche erfolgen.The aim of the fixation (binding, immobilization) is to fix gene product-primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the gene product to the surface.
Die Reihenfolge der Schritte bei der Bindung von Genprodukt- Primer-Komplexen kann variabel sein:The order of the steps in binding gene product-primer complexes can be variable:
4) Die Genprodukt-Primer-Komplexe können zunächst in einer Lösung durch Hybridisierung (Annealing) gebildet und anschließend an die Oberfläche gebunden werden.4) The gene product-primer complexes can first be formed in a solution by hybridization (annealing) and then be bound to the surface.
5) Primer können zunächst auf einer Oberfläche gebunden werden und Genprodukte anschließend an die gebundenen Primer hybridisiert werden, wobei Genprodukt-Primer- Komplexe entstehen (Genprodukte indirekt an die Oberfläche gebunden)5) Primers can first be bound to a surface and gene products can then be hybridized to the bound primers, producing gene product-primer complexes (gene products indirectly bound to the surface)
6) Die Genprodukte können zunächst an die Oberfläche gebunden werden (Gendprodukte direkt an die Oberfläche gebunden) und im anschließenden Schritt die Primer an die gebundenen Genprodukte hybridisiert werden, wobei Genprodukt-Primer-Komplexe entstehen.6) The gene products can first be bound to the surface (gene products bound directly to the surface) and in the subsequent step the primers can be hybridized to the bound gene products, producing gene product-primer complexes.
Die Immobilisierung der Genprodukte an die Oberfläche kann daher durch direkte oder indirekte Bindung erfolgen.The gene products can therefore be immobilized on the surface by direct or indirect binding.
Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials. Dieses Material ist vorzugsweise enzymatischen Reaktionen gegenüber inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, oder Aluminium) oder beliebiges anderes Material, das diesen funktionalen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.In this application, the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning. The surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used. The surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
Falls eine gelartige feste Phase (Oberfläche eines Gels) verwendet wird, so kann dieses Gel z.B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbar (beispielsweise kann ein 1 bis 2% Agarose-Gel oder 5 bis 15% Polyacrylamid Gel verwendet werden) . Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, dass es zu einer wesentlich geringeren unspezifischen Bindung von NT*s an die Oberfläche kommt. Durch die Bindung der Genprodukt- Primer-Komplexe auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt. Diese feste Unterlage kann Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole), Metall (Gold, Silber, oder Aluminium) oder beliebiges anderes Material sein. Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke ist jedoch vorzugsweise größer als die einfache Tiefenschärfe des Objektivs, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z.B. 0,3 μm beträgt, so liegt die Geldicke vorzugsweise zwischen 1 μm und 100 μm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z.B. Agarose-Kügelchen) zusammengesetzte Oberfläche hergestellt werden. Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der Genprodukte bei entsprechender Dichte binden zu können. Die Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2 sein.If a gel-like solid phase (surface of a gel) is used, this gel can be, for example, an agarose or polyacrylamide gel. The gel is preferably freely passable for molecules with a molecular mass below 5000 Da (for example, a 1 to 2% agarose gel or 5 to 15% polyacrylamide gel can be used). Such a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface. By binding the gene product Primer complexes on the surface make it possible to detect the fluorescence signals from built-in NTs * . The signals from free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized. The gel is preferably attached to a solid surface. This solid base can be silicone, glass, ceramic, plastic (for example polycarbonate or polystyrene), metal (gold, silver or aluminum) or any other material. The thickness of the gel is preferably not more than 0.1 mm. However, the gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not get into the focal plane and are therefore detected. If the depth of focus is 0.3 μm, for example, the gel thickness is preferably between 1 μm and 100 μm. The surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (eg agarose beads). The reaction surface must be large enough to be able to bind the necessary number of gene products with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktionsgefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchflußvorrichtung ermöglicht einen Austausch der Lösungen im Reaktionsgefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, dass die Oberfläche nicht austrocknet . Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 μl . Idealerweise beträgt sein Volumen weniger als 1 μl .The different cycle steps require an exchange of the different reaction solutions above the surface. The reaction surface is preferably part of a reaction vessel. The reaction vessel is in turn preferably part of a reaction apparatus with a flow device. The flow device enables the solutions in the reaction vessel to be exchanged. The exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out. The volume of the reaction vessel is preferably less than 50 μl. Ideally, its volume is less than 1 μl.
Falls die Fixierung der Genprodukt-Primer-Komplexe auf der Oberfläche über die Genprodukte erfolgt, kann dies beispielsweise durch die Bindung der Genprodukte an einem der beiden Ketten-Enden erfolgen. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al . US Patent 5412087, Nikiforov et al . US Patent 5610287, Barrett et al . US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al . Analytical Biochemistry v.198, S.138, Allemand et al . Biophysical Journal 1997, v.73, S.2064, Trabesinger et al . Analytical Chemistry 1999, v.71, S.279, Osborne et al . Analytical Chemistry 2000, v.72, S.3678, Timofeev et al . Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al . NAR 1987 v.15 S.5353, Gingeras et al. NAR 1987 v.15 S.5373, Maskos et al . NAR 1992 v.20 S.1679) . Die Fixierung kann auch durch eine unspezifische Bindung, wie z.B. durch Austrocknung der Genprodukte enthaltenden Probe auf der planen Oberfläche erreicht werden. Die Genprodukte werden auf der Oberfläche in einer Dichte zwischen 10 und 100 pro 100 μm2, 100 bis 10.000 pro 100 μm2, 10.000 bis 1000.000 pro lOOμm2 gebunden.If the gene product-primer complexes are fixed on the surface via the gene products, this can for example by binding the gene products at one of the two chain ends. This can be achieved by appropriate covalent, affine or other bonds. Many examples of immobilization of nucleic acids are known (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v.198, p.138, Allemand et al. Biophysical Journal 1997, v.73, p.2064, Trabesinger et al. Analytical Chemistry 1999, v.71, p.279, Osborne et al. Analytical Chemistry 2000, v.72, p.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679). The fixation can also be achieved by a non-specific binding, for example by drying out the sample containing gene products on the flat surface. The gene products are bound to the surface at a density between 10 and 100 microns per 100 2, 100 to 10,000 per 100 micron 2, 10,000 to 1000,000 per lOOμm. 2
Die für die Detektion notwendige Dichte von extensionsfähigen Genprodukt-Primer-Komplexen beträgt ca. 10 bis 100 pro 100 μm2. Sie kann vor, während oder nach der Hybridisierung der Primer an die Genprodukte erreicht werden.The density of extensible gene product-primer complexes required for the detection is approx. 10 to 100 per 100 μm 2 . It can be achieved before, during or after hybridization of the primers to the gene products.
Beispielhaft werden im folgenden einige Methoden zur Bindung näher dargestellt :Some binding methods are described in more detail below:
In einer Ausführungsform erfolgt die Bindung der Genprodukt- Primer-Komplexe über Biotin-Avidin oder Biotin-Streptavidin- Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5 ' -Ende des Primers ist mit Biotin modifiziert. Nach der Hybridisierung der modifizierten Primer mit den Genprodukten (in Lösung) werden diese auf der mit Avidin/Streptavidin beschichteten Oberfläche fixiert . Die Konzentration der mit Biotin markierten Genprodukt-Primer- Komplexe sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, dass eine für die Sequenzierung geeignete Dichte erreicht wird.In one embodiment, the gene product-primer complexes are bound via biotin-avidin or biotin-streptavidin binding. Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer is modified with biotin. After hybridization of the modified primers with the gene products (in solution), these are fixed on the surface coated with avidin / streptavidin. The concentration of the gene product primer labeled with biotin Complexes as well as the time of incubation of this solution with the surface are chosen in such a way that a density suitable for sequencing is achieved.
In einer anderen Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion auf der Oberfläche mit geeigneten Methoden fixiert (s.o.). Die einzelsträngigen Genprodukte mit jeweils einer Primerbindungsstelle pro Genproduktmolekül werden damit unter Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden sie an die fixierten Primer und werden dadurch an die Oberfläche gebunden (indirekte Bindung) . Die Konzentration der einzelsträngigen Genprodukte und die Hybridisierungsparameter (z.B. Temperatur, Zeit, Puffer) werden so gewählt, dass man eine für die Sequenzierung geeignete Dichte von ca. 10 bis 100 extensionsfähigen Genprodukt-Primer-Komplexen pro 100 μm2 erreicht. Nach der Hybridisierung werden ungebundene Genprodukte durch einen Waschschritt entfernt. Bei dieser Ausführungsform wird eine Oberfläche mit einer hohen Primerdichte bevorzugt, z.B. ca. 1.000.000 Primer pro lOOμm2 oder noch höher, da die gewünschte Dichte an Genprodukt-Primer-Komplexen schneller erreicht wird, wobei die Genprodukte nur an einen Teil der Primer binden.In another embodiment, the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above). The single-stranded gene products, each with one primer binding site per gene product molecule, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thus bound to the surface (indirect binding). The concentration of the single-stranded gene products and the hybridization parameters (eg temperature, time, buffer) are selected so that a density of approximately 10 to 100 gene product-primer complexes capable of extension per 100 μm 2 is achieved which is suitable for sequencing. After hybridization, unbound gene products are removed by a washing step. In this embodiment, a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 μm 2 or even higher, since the desired density of gene product-primer complexes is achieved more quickly, the gene products binding only to a part of the primers ,
In einer anderen Ausführungsform werden die Genprodukte an die Oberfläche direkt gebunden (s.o.) und anschließend mit Primern unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte von ca. 10 bis 100 Genprodukte pro lOOμm2 wird man versuchen alle verfügbaren Genprodukte mit einem Primer zu versehen und für die Sequenzierugnsreaktion verfügbar zu machen. Dies kann durch hohe Primerkonzentration beispielsweise 1 bis 100 mmol/1 erreicht werden. Bei einer höheren Dichte der fixierten Genprodukte auf der Oberfläche, beispielsweise 10.000 bis 1.000.000 pro lOOμm2, kann die für die optische Detektion notwendige Dichte der Genprodukt-Primer-Komplexe während der Primer-Hybridisierung erreicht werden. Dabei sind die Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer, Primerkonzentratin) so ' zu wählen, dass die Primer nur an einen Teil der immobilisierten Genprodukte binden.In another embodiment, the gene products are bound directly to the surface (see above) and then incubated with primers under hybridization conditions. At a density of approx. 10 to 100 gene products per 100 μm 2 , attempts will be made to provide all available gene products with a primer and to make them available for the sequencing reaction. This can be achieved by high primer concentration, for example 1 to 100 mmol / 1. With a higher density of the fixed gene products on the surface, for example 10,000 to 1,000,000 per 100 μm 2 , the density of the gene product-primer complexes required for optical detection can be achieved during the primer hybridization. The hybridization conditions (e.g. temperature, time, buffer, Primer concentrate) ' so that the primers bind only to a part of the immobilized gene products.
Falls die Oberfläche einer festen Phase (z.B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlösung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.If the surface of a solid phase (eg silicone or glass) is used for immobilization, a blocking solution is preferably applied to the surface before step (a) in each cycle, which serves to avoid non-specific adsorption of NTs * on the surface. For example, an albumin solution (BSA) with a pH between 8 and 10 fulfills these conditions for a blocking solution.
Wahl der Polymerase :Choice of polymerase:
Bei der Wahl der Polymerase spielt die Art der verwendeten immobilisierten Nukleinsäure (RNA oder DNA) eine entscheidende Rolle:The type of immobilized nucleic acid (RNA or DNA) used plays a decisive role in the choice of polymerase:
Falls RNA als Genprodukt (z.B. mRNA) in die Sequenzierungsreaktion eingesetzt wird, können handelsübliche RNA-abhängige DNA-Polymerasen eingesetzt werden, z.B. AMV- Reverse Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNAse-Aktivität. Alle Reverse Transcriptasen müssen von RNAse-Aktivität weitgehend frei sein ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory) .If RNA is used as a gene product (e.g. mRNA) in the sequencing reaction, commercially available RNA-dependent DNA polymerases can be used, e.g. AMV reverse transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNAse activity. All reverse transcriptases must be largely free of RNAse activity ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory).
Falls DNA als Genprodukt (z.B. cDNA) verwendet wird, eignen sich als Polymerasen prinzipiell alle DNA-abhängigen DNA- Poly erasen ohne 3"-5" Exonuklease-Aktivität (DNA- Replication" 1992 Ed. A. Kornberg, Freeman and Company NY) , z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia Biotech) , Klenow Fragment der DNA-Poly- merase I ohne 3 '-5' Exonukleaseaktivität (Amersham Pharmacia Biotech) , Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie Taq-Polymerase (GibcoBRL) , proHA-DNA-Polymerase (Eurogentec) . Detektion:If DNA is used as a gene product (eg cDNA), all DNA-dependent DNA polyases without 3 "-5" exonuclease activity (DNA replication "1992 Ed. A. Kornberg, Freeman and Company NY) are suitable in principle as polymerases. , eg modified T7 polymerase of the "Sequenase Version 2" type (Amersham Pharmacia Biotech), Klenow fragment of DNA polymerase I without 3 '-5' exonuclease activity (Amersham Pharmacia Biotech), polymerase beta of various origins (animal cell DNA polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHA DNA polymerase (Eurogentec). detection:
Wie bei der Sequenzierung langer NSKs, umfasst die Detektion folgende Phasen:As with the sequencing of long NSKs, the detection comprises the following phases:
1) Vorbereitung zur Detektion1) Preparation for detection
Durchführung eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt als Scanvorgang abläuft und folgende Operationen umfaßt : a) Einstellung der Position des Objektivs (X, Y-Achse) , b) Einstellung der Fokusebene (Z-Achse) , c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen Genprodukt , d) Verschiebung zur nächsten Position auf der Oberfläche.Carrying out a detection step in each cycle, each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the objective (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the signals of individual people Molecules, assignment of the signal to NT * and assignment of the signal to the respective gene product, d) shift to the next position on the surface.
Die Signale von in die den Genprodukten komplementären Stränge eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang wird wie bei der Sequenzieurng langer NSKs durchgeführt. Dabei wird das Objektiv schrittweise über die Oberfläche bewegt, so daß von jeder Oberflächenposition ein zweidimensionales Bild (2D- Bild) entsteht.The signals from NTs * built into the strands complementary to the gene products are registered by scanning the surface. The scanning process is carried out as with the sequencing of long NSKs. The lens is gradually moved over the surface, so that a two-dimensional image (2D image) is created from each surface position.
Vorbereitung zur Detektion:Preparation for detection:
Am Anfang wird festgelegt, wie viele Kopien der Genprodukte zur Expressionsanalyse notwendig sind. Mehrere Faktoren spielen dabei eine Rolle. Die genaue Zahl hängt z.B. von der relativen Präsenz der Genprodukte im Ansatz und von der gewünschten Genauigkeit der Analyse ab. Die Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 10.000.000. Für stark exprimierte Gene kann die Anzahl der analysierten Genprodukte niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse schwach exprimierter Gene muß sie erhöht werden, z.B. auf 100.000 oder noch weiter.At the beginning it is determined how many copies of the gene products are necessary for the expression analysis. Several factors play a role in this. The exact number depends e.g. on the relative presence of the gene products in the approach and on the desired accuracy of the analysis. The number of gene products analyzed is preferably between 1000 and 10,000,000. For highly expressed genes, the number of gene products analyzed can be low, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or even further.
Es werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig analysiert. Dabei werden auch schwach exprimierte Gene (mit z.B. ca.100 mRNA-Molekülen/Zelle, was ca. 0.02% gesamt-mRNA entspricht) in der Reaktion mit durchschnittlich 20 identifizierten Genprodukten repräsentiert .For example, 100,000 individual gene products are analyzed simultaneously. In this way, weakly expressed genes (e.g. with approx. 100 mRNA molecules / cell, what approx. 0.02% total mRNA corresponds) in the reaction with an average of 20 identified gene products.
2) Durchführung eines Detektionsschrittes in jedem Zyklus gleicht der in der Sequenzierung langer NSKs. Anstelle von NSKFs werden Genprodukte verwendet .2) Performing a detection step in each cycle is the same as in the sequencing of long NSKs. Genetic products are used instead of NSKFs.
Analyse :Analysis:
Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines Programms mit bekannten Gensequenzen verglichen. Einem solchen Programm kann z.B. ein BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .The data obtained (short sequences) are compared using a program with known gene sequences. Such a program can e.g. based on a BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Durch die Wahl der Methode zur Materialvorbereitung wird unter anderem festgelegt, in welchen Abschnitten der Genprodukte die Sequenzen ermittelt werden und zu welchem Strang (sense oder antisense) sie gehören. Z.B. werden bei der Verwendung der polyA-Strecken als Primerbindungsstelle in mRNA Sequenzen aus NTRs (non-translating-regions) bestimmt. Bei der Verwendung der Methode mit antisense-cDNA als Matrize stammen die ermittelten Sequenzen unter anderem aus den proteinkodierenden Bereichen der Genprodukte.The choice of the method for material preparation determines, among other things, in which sections of the gene products the sequences are determined and to which strand (sense or antisense) they belong. For example, are determined when using the polyA stretches as primer binding sites in mRNA sequences from NTRs (non-translating regions). When using the method with antisense cDNA as a template, the sequences determined come, inter alia, from the protein-coding regions of the gene products.
Bei einer bevorzugten einfachen Variante der Erfindung wird die Genexpression nur qualitativ bestimmt. Dabei ist nur die Tatsache der Expression bestimmter Gene von Bedeutung.In a preferred simple variant of the invention, the gene expression is only determined qualitatively. Only the fact that certain genes are expressed is important.
Bei einer anderen bevorzugten Ausführungsform ist eine quantitative Bestimmung der Verhältnisse zwischen einzelnen Genprodukten im Ansatz von Interesse. Es ist bekannt, daß die Aktivität eines Gens in einer Zelle durch eine Population identischer mRNA-Moleküle repräsentiert ist . In einer Zelle sind viele Gene gleichzeitig aktiv und werden dabei unterschiedlich stark exprimiert, was zum Vorhandensein vieler verschiedener unterschiedlich stark repräsentierter mRNA-Populationen führt. Im folgenden wird auf die quantitative Analyse der Genexpression näher eingegangen:In another preferred embodiment, a quantitative determination of the relationships between individual gene products in the batch is of interest. It is known that the activity of a gene in a cell is represented by a population of identical mRNA molecules. Many genes are active in a cell at the same time and are expressed to different extents, which leads to the presence of many different mRNA populations with different strengths. The quantitative analysis of gene expression is discussed in more detail below:
Für eine quantitative Analyse der Genexpression werden die Abundanzen ' einzelner Genprodukte in der Sequenzierungsreaktion bestimmt . Dabei sind die Produkte stark exprimierter Gene in der Sequenzierungsreaktion häufiger vertreten als die schwach exprimierter Gene. Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der Anteil der ermittelten Sequenzen für jedes einzelne Gen bestimmt-. Gene mit starker Expression haben einen höheren Anteil an der Gesamtpopulation der Genprodukte als Gene mit schwacher Expression.For quantitative analysis of gene expression abundances' individual gene products are determined in the sequencing reaction. The products of highly expressed genes are more frequently represented in the sequencing reaction than the poorly expressed genes. After assigning the sequences to specific genes, the proportion of the sequences determined is determined for each individual gene. Genes with strong expression have a higher proportion of the total population of gene products than genes with weak expression.
Die Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 10.000.000. Die genaue Anzahl der zu analysierenden Genprodukte hängt von der Aufgabenstellung ab. Für stark exprimierte Gene kann sie niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse schwach exprimierter Gene muß sie erhöht werden, z.B. auf 100.000 oder höher.The number of gene products analyzed is preferably between 1000 and 10,000,000. The exact number of gene products to be analyzed depends on the task. It can be low for highly expressed genes, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or higher.
Werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig analysiert, sind auch schwach exprimierte Gene, wie z.B. ca.100 mRNA-Moleküle/Zelle (was ca. 0.02% gesamt- mRNA entspricht) , in der Reaktion mit durchschnittlich 20 identifizierten Genprodukten repräsentiert ,If, for example, 100,000 individual gene products are analyzed at the same time, weakly expressed genes such as e.g. approx. 100 mRNA molecules / cell (which corresponds to approx. 0.02% total mRNA), represented in the reaction with an average of 20 identified gene products,
Als interne Kontrolle der Hybridisierung, der Immobilisation und der Sequenzierungsreaktion läßt sich folgende Methode verwenden:The following method can be used as internal control of the hybridization, the immobilization and the sequencing reaction:
Es können eine oder mehrere Nukleinsäureketten mit bekannten Sequenzen als Kontrolle eingesetzt werden. Die Zusammensetzung dieser Kontrollsequenzen ist nicht eingeschränkt, sofern sie die Identifizierung der Genprodukte nicht störten. Bei der Sequenzanalyse der mRNA-Proben werden RNA-Kontrollproben, bei der Analyse der cDNA-Proben entsprechend DNA-Kontrollproben eingesetzt. Diese Proben werden vorzugsweise bei allen Schritten mitgeführt . Sie können z.B. nach der mRNA- Isolation zugegeben werden. Im allgemeinen werden die Kontrollproben in gleicher Weise zur Sequenzanalyse vorbereitet wie die zu analysierenden Genprodukte .One or more nucleic acid chains with known sequences can be used as a control. The composition of these control sequences is not restricted, provided they do not interfere with the identification of the gene products. RNA control samples are used in the sequence analysis of the mRNA samples, and corresponding DNA control samples are used in the analysis of the cDNA samples. These samples are preferably carried along in all steps. she can be added after mRNA isolation, for example. In general, the control samples are prepared for sequence analysis in the same way as the gene products to be analyzed.
Die Kontrollsequenzen werden in bekannten, fest eingestellten Konzentrationen zu den zu analysierenden Genprodukten zugegeben. Konzentrationen der Kontrollproben können unterschiedlich sein, vorzugsweise liegen diese Konzentrationen zwischen 0.01% und 10% der Gesamtkonzentration der zu analysierenden Probe (100%) . Beträgt die Konzentration der mRNA beispielsweise lOng/μl, dann liegen die Konzentrationen von Kontrollproben zwischen lpg/μl und lng/μl .The control sequences are added to the gene products to be analyzed in known, fixed concentrations. Concentrations of the control samples can be different, these concentrations are preferably between 0.01% and 10% of the total concentration of the sample to be analyzed (100%). For example, if the concentration of the mRNA is 10ng / μl, the concentrations of control samples are between 1pg / μl and 1ng / μl.
Bei der quantitativen Analyse der Genexpression muß auch die allgemeine metabolische Aktivität der Zellen berücksichtigt werden, insbesondere, wenn ein Vergleich der Expression bestimmter Gene bei verschiedenen äußeren Bedingungen angestrebt wird.In the quantitative analysis of gene expression, the general metabolic activity of the cells must also be taken into account, in particular when a comparison of the expression of certain genes under different external conditions is sought.
Die Veränderung im Expressionsniveau eines bestimmten Gens kann als Folge der Veränderung in der Transkriptionsrate dieses Gens oder als Folge einer globalen Veränderung der Genexpression in der Zelle auftreten. Zur Beobachtung der metabolischen Zustände in der Zelle kann man die Expression der sogenannten "House-keeping-Gene" analysieren. Beim Mangel an wichtigen Metaboliten ist beispielsweise das allgemeine Expressionsniveau in der Zelle niedrig, so daß auch konstitutiv exprimierte Gene eine niedriges Expressionsniveau haben .The change in the level of expression of a particular gene can occur as a result of the change in the transcription rate of that gene or as a result of a global change in gene expression in the cell. The expression of the so-called "house-keeping genes" can be analyzed to observe the metabolic states in the cell. In the absence of important metabolites, for example, the general level of expression in the cell is low, so that constitutively expressed genes also have a low level of expression.
Im Prinzip können alle konstitutiv exprimierten Gene als "House-keeping-Gene" dienen. Als Beispiele seien das Transferrin-Rezeptor-Gen oder das Beta-Aktin-Gen genannt . Die Expression dieser House-keeping-Gene dient somit alsIn principle, all constitutively expressed genes can serve as "house-keeping genes". Examples include the transferrin receptor gene or the beta actin gene. The expression of these house-keeping genes thus serves as
Bezugsgröße für die Analyse der Expression anderer Gene . DieReference value for the analysis of the expression of other genes. The
Sequenzermittlung und Quantifizierung der Expression derSequence determination and quantification of the expression of the
House-keeping-Gene ist vorzugsweise ein Bestandteil des Analyse-Programms für die Genexpression.House-keeping genes are preferably part of the analysis program for gene expression.
Wie bei der Sequenzierung langer NSKs kann man Sequenzierungsreaktion mit 4 markierten oder 2 markierten und 2 unmarkierten NT* durchführen.As with the sequencing of long NSKs, one can carry out a sequencing reaction with 4 marked or 2 marked and 2 unmarked NT *.
Sequenzanalyse mit 4 markierten NTs*Sequenzanalvse mit - 4 markierten NTs* Sequence analysis with 4 marked NTs * Sequence analysis with - 4 marked NTs *
Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- farbstoffen markiert .In a preferred embodiment of the invention, all four NTs * used in the reaction are labeled with fluorescent dyes.
Dabei verwendet man eine der oben genannten farbigen KodierungsSchemata. Die Zahl der ermittelten NTs für jede Sequenz aus einem Genprodukt liegt zwischen 5 und 100, idealerweise zwischen 20 und 50. Diese ermittelten Sequenzen werden mit Hilfe eines Programms mit bekannten Sequenzen in Gen-Datenbanken verglichen und entsprechenden Genen zugeordnet. Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .One of the color coding schemes mentioned above is used. The number of NTs determined for each sequence from a gene product is between 5 and 100, ideally between 20 and 50. These sequences are compared with a sequence with known sequences in gene databases and assigned to corresponding genes. Such a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Ein Zyklus hat folgende Schritte : a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten, b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen d) Detektion der Signale von einzelnen Molekülen e) Entfernung der Markierung von den eingebauten Nukleotiden und des zur Termination führenden Substituenten, f) Waschen.A cycle has the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains, b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) Washing d) Detection of signals from individual molecules e) Removal of the label from the built-in nucleotides and that leading to the termination Substituents, f) washing.
Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs (2NTs* / 2NTs-Methode) .Sequence analysis with 2 marked NTs * and 2 unmarked NTs (2NTs * / 2NTs method).
In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs eingesetzt .In another embodiment, 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
Diese Ausführungsform beruht auf dem Prinzip, daß eine Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz verglichen und einer bestimmten Position zugeordnet, z.B.:This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence. The determined sequence is compared with the reference sequence and assigned to a specific position, for example:
ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind markiert)ACCAAAACACCC - determined sequence (dCTP * and dATP * are marked)
ATCATCGTTCGAAATATCGATCGCCTGATGCC - ReferenzsequenzATCATCGTTCGAAATATCGATCGCCTGATGCC - reference sequence
A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz)A-C C-AAA-A-C-A-C-CC (assigned determined sequence)
ATCATCGTTCGAAATATCGATCGCCTGATGCC (Referenzsequenz)ATCATCGTTCGAAATATCGATCGCCTGATGCC (reference sequence)
Vorzugsweise wird die ermittelten Sequenzen mit Hilfe eines Programms der Referenzsequenz zugeordnet. Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .The ascertained sequences are preferably assigned to the reference sequence with the aid of a program. Such a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Die Genprodukte werden wie oben beschrieben zur Sequenzierung vorbereitet und mit 2NTs*/2NTs-Methode sequenziert. Man erhält Sequenzenabschnitte aus Genprodukten, wobei jede Sequenz eine Abfolge aus 2NTs* darstellt . Bekannte Gensequenzen dienen als Referenzsequenzen. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten Sequenzen mehr als 20 NT*s . Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 20 detektierten NTs* beträgt die Gesamtlänge z.B. durchschnittlich 40 NTs) .The gene products are prepared for sequencing as described above and sequenced using the 2NTs * / 2NTs method. Sequence sections are obtained from gene products, each sequence representing a sequence of 2NTs * . Known gene sequences serve as reference sequences. To be clear To enable the determined sequence to be assigned to a known reference sequence, this sequence must be long enough. The length of the sequences determined is preferably more than 20 NT * s. Since 2 marked NTs * represent only part of the sequence, the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 20 detected NTs * , the total length is, for example, an average of 40 NTs).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d.h. die Termination ausschließlich bei Verfügbarkeit modifizierter NTs* auftritt, müssen unmodifizierte NTs in einem zusätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, daß die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.4 nucleotides are required to synthesize a complementary strand. Since the NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgendermaßen aussehen:A cycle in this embodiment may look as follows, for example:
a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten Genprodukten b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen d) Detektion der Signale von einzelnen, modifizierten und in die den Genprodukten komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden f) Waschen g) Zugabe von 2 unmodifizierten NTs und Polymerasen h) Waschen.a) adding a solution with modified NTs * and polymerases to the surface with the gene products provided b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) washing d) detecting the signals from individual, modified NTs * molecules built into the newly synthesized strands complementary to the gene products e) removal of the label and the terminating group in the built-in nucleotides f) washing g) addition of 2 unmodified NTs and polymerases h) washing.
Die Konzentration der NTs liegt vorzugsweise unter 1 M, idealerweise unter 10 μM.The concentration of the NTs is preferably below 1 M, ideally below 10 μM.
Beispiel 4:Example 4:
Eine besondere Ausführungsform des Verfahrens stellt die Analyse von Einzelnukleotidpolymorphismen mit sequenzspezifischen Primern dar.A special embodiment of the method is the analysis of single nucleotide polymorphisms with sequence-specific primers.
Zusätzlich zu Abschnitt 1 "Abkürzungen und Begriffserläuterungen" werden für dieses Beispiel folgende Begriffe definiert :In addition to Section 1 "Abbreviations and Definitions", the following terms are defined for this example:
Primer - Zur Verdeutlichung des er inderischen Gedankens werden in diesem Beispiel folgende Begriffe unterschieden: a) Unter einem §Primer" wird vorliegend allgemein eine Population von Primermolekülen mit einheitlicher Struktur verstanden. b) ^mehrere Primer"" o.a. werden im Text als mehrere Populationen von Primermolekülen verstanden, die unterschiedliche Struktur besitzen. c) Ein §Primer-Molekül§ bedeutet ein einziges Oligonukleotid-Molekül . d) ^Mehrere Primer-Moleküleξjξ bedeuten mehrere einzelne Oligonukleotid-Moleküle; sie können einheitliche oder unterschiedliche Struktur aufweisen.Primer - In order to clarify the Indian idea, the following terms are distinguished in this example: a) In the present case, a "primer" is generally understood to mean a population of primer molecules with a uniform structure Understand primer molecules that have different structures. C) A "primer molecule" means a single oligonucleotide molecule. D) ^ Several primer moleculesξjξ mean several individual oligonucleotide molecules; they can have a uniform or different structure.
SNP-Stelle - eine Position in NSK, die auf Vorhandensein oder Abwesenheit von SNP untersucht wird.SNP position - a position in NSK that is checked for the presence or absence of SNP.
Zielsequenz - Teil einer Gesamtsequenz, der durch die Verwendung eines spezifischen Primers in der Sequenzierungsreaktion sequenziert/ bestimmt wird. Eine Gesamtsequenz kann mehrere Zielsequenzen enthalten. Eine Zielsequenz ist genügend lang, um eine Positionierung dieser Zielsequenz innerhalb der Gesamtsequenz mit großer Wahrscheinlichkeit zu gewährleisten. Zielsequenzen können beispielsweise eine oder mehrere SNP-Stellen enthalten.Target Sequence - Part of an overall sequence that is sequenced / determined using a specific primer in the sequencing reaction. A Entire sequence can contain several target sequences. A target sequence is long enough to ensure that it is very likely to be positioned within the overall sequence. Target sequences can contain one or more SNP sites, for example.
Erkennungssequenz - Teil der Zielsequenz, der für die Zuordnung dieser Zielsequenz in der Gesamtsequenz verwendet wird.Detection Sequence - Part of the target sequence that is used to assign this target sequence to the overall sequence.
In dieser Ausführungsform zur SNP-Analyse werden mehrere potentielle SNP-Positionen in der Referenzsequenz ausgewählt, die in einer zu analysierenden NSK untersucht werden. Zu diesen Positionen werden entsprechend unterschiedliche, sequenzspezifische Primer bereitgestellt. Diese Primer können einen standardisierten Primersatz zur SNP-Analyse bei einer bestimmten Fragestellung bilden und einheitlich als Kit für die betreffende Analysen eingesetzt werden.In this embodiment for SNP analysis, several potential SNP positions in the reference sequence are selected which are examined in an NSK to be analyzed. Accordingly, different, sequence-specific primers are provided for these positions. These primers can form a standardized primer set for SNP analysis for a specific question and can be used as a kit for the relevant analyzes.
Die Vorbereitung des zu analysierenden Materials (auf SNP zu untersuchende einzel- und doppelsträngige Nukleinsäureketten) hat erfindungsgemäß das Ziel, aus einer oder mehreren langen Nukleinsäureketten (Gesamtsequenz) eine Population an relativ kleinen, zwischen 30 und 2000 NT langen, einzelsträngigen Nukleinsäurekettenfragmenten (NSKFs) zu bilden.The preparation of the material to be analyzed (single and double-stranded nucleic acid chains to be examined for SNP) has the aim according to the invention of creating a population of relatively small, between 30 and 2000 NT long, single-stranded nucleic acid chain fragments (NSKFs) from one or more long nucleic acid chains (overall sequence) form.
Diese NSKF-Moleküle werden zufällig auf einer planen Oberfläche mit einer Dichte zwischen 10 und 1.000.000 pro 100 μm2, vorzugsweise 10 und 100 NSKFs pro 100 μm2, 100 bis 10.000 pro 100 μm2 oder 10.000 bis 1.000.000 pro lOOμm2 immobilisiert. An die auf der Oberfläche gebundenen NSKFs werden Primer hybridisiert, so dass die Dichte der extensionsfähigen NSKF- Primer-Komplexe ca. 10-100 pro lOOμm2 beträgt. Nach der Hybridisierung werden nicht gebundene Primer entfernt und die Sequenzierungsreaktion gestartet .These NSKF molecules happen to be random on a flat surface with a density between 10 and 1,000,000 per 100 μm 2 , preferably 10 and 100 NSKFs per 100 μm 2 , 100 to 10,000 per 100 μm 2 or 10,000 to 1,000,000 per 100 μm 2 immobilized. Primers are hybridized to the NSKFs bound on the surface, so that the density of the NSKF primer complexes capable of extension is approximately 10-100 per 100 μm 2 . After hybridization, unbound primers are removed and the sequencing reaction started.
Durch eine Auswahl der Zielsequenzen und der sequenzspezifischen Primer werden nur die relevantenBy selecting the target sequences and the sequence-specific primers are only the relevant ones
Abschnitte der Gesamtsequenz untersucht, was die Menge nicht relevanter Informationen verringert und die Analysezeit verkürzt .Sections of the overall sequence examine what reduces the amount of irrelevant information and shortens the analysis time.
Dieser Ausführungsform des Verfahrens zur SNP-Analyse liegen folgende Prinzipien zugrunde:This embodiment of the method for SNP analysis is based on the following principles:
Es werden Stellen in einer Referenzsequenz ausgewählt, die in den zu untersuchenden NSKs (Gesamtsequenz) auf Einzelnukleotidpolymorphismen (SNPs) überprüft werden sollen.Locations in a reference sequence are selected which are to be checked for single nucleotide polymorphisms (SNPs) in the NSKs to be examined (overall sequence).
1) Zur Analyse jeder ausgewählten SNP-Stelle werden spezifische Primer bereitgestellt, so dass jede zu untersuchende SNP-Stelle entweder die nächste Position in 3g-Richtung vom Primer einnimmt oder innerhalb von 2 bis 100, vorzugsweise 2 bis 50, idealerweise 2 bis 20 Positionen in 3§-Richtung vom Primer liegt. Die SNP- Stelle liegt somit innerhalb der Zielsequenz, die während der Sequenzierungsreaktion bestimmt wird. Es werden vorzugsweise mehrere SNP-Stellen gleichzeitig analysiert, so dass mehrere spezifische Primer verwendet werden müssen. Die Primer werden vorzugsweise so ausgewählt, dass sie möglichst einheitliche Annealing- Temperaturen haben, d.h. Unterschiede zwischen Schmelztemperaturen einzelner Primerpopulationen liegen beispielsweise innerhalb eines Bereichs von ca. 4 Grad, besser innerhalb von 2 Grad, noch besser innerhalb von 1 Grad.1) Specific primers are provided for the analysis of each selected SNP site, so that each SNP site to be examined either occupies the next position in the 3 g direction from the primer or within 2 to 100, preferably 2 to 50, ideally 2 to 20 positions in the 3§ direction from the primer. The SNP site is thus within the target sequence that is determined during the sequencing reaction. Several SNP sites are preferably analyzed simultaneously, so that several specific primers have to be used. The primers are preferably selected so that they have annealing temperatures that are as uniform as possible, i.e. Differences between melting temperatures of individual primer populations are, for example, within a range of approximately 4 degrees, better within 2 degrees, even better within 1 degree.
2) Von der Gesamtsequenz werden kurze Nukleinsäurekettenfragmente (NSKFs) abgeleitet, wobei diese Fragmente einzelsträngig sind und eine Länge von 20 bis 2000 NT, vorzugsweise 30 bis 500 NT besitzen.2) Short nucleic acid chain fragments (NSKFs) are derived from the total sequence, these fragments being single-stranded and having a length of 20 to 2000 NT, preferably 30 to 500 NT.
3) NSKF-Moleküle werden in einer zufälligen Anordnung auf der Oberfläche immobilisiert .3) NSKF molecules are arranged in a random order immobilized on the surface.
4) Nach der Hybridisierung (Annealing) von sequenzspezifischen Primern an die auf der Oberfläche immobilisierten NSKFs wird eine zyklische Sequenzierungsreaktion durchgeführt, wobei für jedes an der Reaktion beteiligte NSKF-Molekül eine Zielsequenz ermittelt wird. Die Sequenzierungsreaktion läuft an vielen Molekülen gleichzeitig ab.4) After the hybridization (annealing) of sequence-specific primers to the NSKFs immobilized on the surface, a cyclic sequencing reaction is carried out, a target sequence being determined for each NSKF molecule involved in the reaction. The sequencing reaction takes place on many molecules simultaneously.
5) Die ermittelten Zielsequenzen enthalten Information über die Zugehörigkeit zu einem bestimmten Abschnitt in der Gesamtsequenz und über den SNP in diesem Abschnitt bei der zu untersuchenden Probe. Die Länge der Zielsequenzen und somit die Zahl der Zyklen ist so zu wählen, dass eine Identifizierung der Sequenzen gewährleistet werden kann.5) The determined target sequences contain information about the affiliation to a certain section in the overall sequence and about the SNP in this section for the sample to be examined. The length of the target sequences and thus the number of cycles should be selected so that an identification of the sequences can be guaranteed.
In einer vorteilhaften Ausführungsform werden die ermittelten Zielsequenzen mit der Referenzsequenz verglichen und durch Sequenzübereinstimmung zugeordnet. Bei einer genügend langen ermittelten Zielsequenz kann man sie mit großer Wahrscheinlichkeit zu einer bestimmten Position in der Referenzsequenz zuordnen. Beispielsweise kann eine Sequenz aus 10 NTs mehr als 10ε verschiedene Kombinationen bilden und somit mit einer großen Wahrscheinlichkeit in einer NSK von nur 100.000 NT eindeutig identifiziert werden. Nach der Zuordnung der ermittelten Zielsequenz zur bestimmten Position innerhalb der Referenzsequenz werden Unterschiede in den Sequenzen, die SNPs, sichtbar.In an advantageous embodiment, the determined target sequences are compared with the reference sequence and assigned by sequence matching. If the target sequence is sufficiently long, it is very likely that it can be assigned to a specific position in the reference sequence. For example, a sequence of 10 NTs can form more than 10 ε different combinations and can therefore be identified with a high probability in an NSC of only 100,000 NT. After assigning the determined target sequence to the specific position within the reference sequence, differences in the sequences, the SNPs, become visible.
Zur Identifizierung der Zielsequenzen wird in einer anderen vorteilhaften Ausführungsform sowohl die bereits bekannte Anzahl der Primer, ihre Zusammensetzung und ein bereits bekannter, an die Primerbindungsstelle anschließender Sequenzabschnitt der Referenzsequenz verwendet . Dabei werden die ermittelten Zielsequenzen nach ihrer Zugehörigkeit zu den Primern analysiert, wobei nur die nah an der Primerbindungsstelle liegenden Sequenzen berücksichtigt werden müssen. Wenn beispielsweise nur 1000 Primer verwendet werden, reichen weniger als 10 NTs der ermittelten Zielsequenzen, um eine Zuordnung zu den entsprechenden Primern zu ermöglichen.In another advantageous embodiment, the already known number of primers, their composition and an already known sequence section of the reference sequence which adjoins the primer binding site are used to identify the target sequences used. The target sequences determined are analyzed according to their affiliation with the primers, only the sequences close to the primer binding site having to be taken into account. If, for example, only 1000 primers are used, fewer than 10 NTs of the determined target sequences are sufficient to enable an assignment to the corresponding primers.
Die zu analysierende Probe enthält meistens mehrere identische Gesamtsequenzmoleküle, z.B. mehrere Kopien von genomischer DNA aus Zellen eines Gewebes oder mehrere identische mRNA-Populationen aus Zellen eines Gewebes.The sample to be analyzed usually contains several identical total sequence molecules, e.g. multiple copies of genomic DNA from cells of a tissue or multiple identical mRNA populations from cells of a tissue.
a) Wahl der SNP-Stellea) Choice of the SNP position
Mit der erfindungsgemäßen Methode kann man sowohl bekannte SNP-Stellen analysieren als auch neue SNP-Stellen ermitteln. Als potentielle SNP-Stelle kann jede Position in der NSK auftreten. Die Auswahl richtet sich nach der Fragestellung, z.B. SNP-Analyse in Genen, deren Produkte mit bestimmten Krankheiten assoziiert sind, oder SNP-Analyse in konservierten, kodierenden Abschnitten der Gene, die für Membranrezeptoren kodieren, oder Überprüfung bekannter SNP- Stellen in regulatorischen Sequenzen von Genen, die für die Zellteilung wichtig sind.The method according to the invention can be used to analyze known SNP positions as well as to determine new SNP positions. Any position in the NSK can appear as a potential SNP position. The selection depends on the question, e.g. SNP analysis in genes whose products are associated with certain diseases, or SNP analysis in conserved, coding sections of the genes that code for membrane receptors, or checking known SNP sites in regulatory sequences of genes that are important for cell division.
Eine zu analysierende SNP-Stelle liegt innerhalb einer Zielsequenz, die während der Sequenzierungsreaktion bestimmt wird. Man kann mehrere SNP-Stellen innerhalb einer Zielsequenz ermitteln. Man kann andererseits auch mehrere Zielsequenzen z.B. innerhalb eines Gens wählen. Wichtig dabei ist, dass die Zielsequenzen in genügendem Abstand voneinander in der Gesamtsequenz liegen. Dieser Abstand ist notwendig, damit nur ein sequenzspezifischer Primer pro NSKF hybridisiert, und er ist von der durchschnittlichen NSKF-Länge abhängig: je kürzer die NSKFs, desto näher aneinander können Zielsequenzen liegen. Die SNP-Stellen können bei angemessener Primer-Wahl an beiden Strängen einer doppelsträngigen Nukleinsäurekette analysiert werden.An SNP site to be analyzed lies within a target sequence that is determined during the sequencing reaction. You can identify multiple SNP locations within a target sequence. On the other hand, one can also select several target sequences, for example within one gene. It is important that the target sequences are at a sufficient distance from one another in the overall sequence. This distance is necessary so that only one sequence-specific primer hybridizes per NSKF, and it depends on the average NSKF length: the shorter the NSKFs, the closer the target sequences can be. With an appropriate choice of primers, the SNP sites can do both Strands of a double-stranded nucleic acid chain are analyzed.
Das Verfahren bietet auch die Möglichkeit, beispielsweise mehrere SNP-Stellen aus vielen Individuen (als Stichprobe einer Population) gleichzeitig zu kontrollieren. Dadurch kann z.B. das SNP-Profil einer Population untersucht werden.The method also offers the possibility, for example, of controlling several SNP positions from many individuals (as a sample of a population) at the same time. This can e.g. the SNP profile of a population are examined.
b) Primer für die Sequenzierungsreaktionb) primers for the sequencing reaction
Sequenzierungsreaktion an einem einzelnen NSKF-Molekül wird durch ein Primer-Molekül ermöglicht. Ein sequenzspezifischer Primer ist erfindungsgemäß notwendig, um die Sequenzierungsreaktion jeweils an einer bestimmten / spezifischen Zielsequenz innerhalb der Gesamtsequenz durchführen zu können. Der für die Analyse einer SNP-Stelle, bzw. einer Zielsequenz einzusetzende sequenzspezifische Primer stellt eine Population von Primer-Molekülen mit identischer Struktur dar. Für die Analyse mehrerer, unterschiedlicher Zielsequenzen sind mehrere unterschiedliche Primer-Populationen notwendig.Sequencing reaction on a single NSKF molecule is made possible by a primer molecule. According to the invention, a sequence-specific primer is necessary in order to be able to carry out the sequencing reaction in each case on a specific / specific target sequence within the overall sequence. The sequence-specific primer to be used for the analysis of an SNP site or a target sequence represents a population of primer molecules with an identical structure. Several different primer populations are necessary for the analysis of several different target sequences.
Durch die Verwendung sequenzspezifischer Primer werden nur die relevanten Sequenzabschnitte, die Zielsequenzen, analysiert . Im erfindungsgemäßen Verfahren wird die zu sequenzierende Länge der Sequenzen möglichst niedrig gehalten, damit die Geschwindigkeit der Analyse steigt.By using sequence-specific primers, only the relevant sequence segments, the target sequences, are analyzed. In the method according to the invention, the length of the sequences to be sequenced is kept as short as possible so that the speed of the analysis increases.
Ein sequenzspezifischer Primer bindet an eine für ihn spezifische Primerbindungsstelle in der zu analysierenden Sequenz, PBS. Die Zusammensetzung und die Länge der Primer werden für jede potentielle SNP-Stelle, bzw. Zielsequenz, optimiert. Beispiele für Optimierungsschritte sind in Rychlik et al. NAR 1990 v.18 S.6409 dargestellt. Bei der Primerwahl bzw. bei der Wahl der PBS (Primerbindungsstelle) sind folgende Aspekte besonders zu berücksichtigen:A sequence-specific primer binds to a specific primer binding site in the sequence to be analyzed, PBS. The composition and length of the primers are optimized for each potential SNP site or target sequence. Examples of optimization steps are in Rychlik et al. NAR 1990 v.18 p.6409 shown. When choosing a primer or choosing a PBS (priming agent), the following aspects must be taken into account:
1) Die zu analysierende SNP-Stelle sollte entweder gleich nach dem 3 ' -Ende des Primers oder innerhalb der nächsten 2 bis 50 NTs, vorzugsweise 2 bis 20 NTs liegen .1) The SNP position to be analyzed should either be the same after the 3 'end of the primer or within the next 2 to 50 NTs, preferably 2 to 20 NTs.
2) Die Positionierung (die Wahl der Sequenzlänge und der Zusammensetzung) der PBS zu SNP-Stelle sollte so erfolgen, dass die verschiedenen PBS-Sequenzen und die korrespondierenden Primer-Sequenzen möglichst ähnliche §Annealing-Temperaturen§ besitzen, um bei möglichst einheitlichen Hybridisierungsbedingungen zu binden. Das kann beispielsweise durch Veränderung der PBS-Position im Bezug auf die jeweilige, zu analysierende SNP-Stelle oder durch die Veränderung der Primersequenzlänge erfolgen (Rychlik et al . NAR 1990 v.18 S.6409) .2) The positioning (the choice of the sequence length and the composition) of the PBS to the SNP site should take place in such a way that the different PBS sequences and the corresponding primer sequences have as similar as possible "annealing temperatures" in order to achieve the most uniform hybridization conditions possible tie. This can be done, for example, by changing the PBS position in relation to the respective SNP site to be analyzed or by changing the length of the primer sequence (Rychlik et al. NAR 1990 v.18 p.6409).
3) Der minimale Abstand zwischen Primern, die an denselben Strang in der Gesamtsequenz binden, sollte die durchschnittliche NSKF-Länge nicht unterschreiten.3) The minimum distance between primers that bind to the same strand in the overall sequence should not be less than the average NSKF length.
Es können Primer für beide Stränge einer Doppelstrang-NSK verwendet werden. Damit lassen sich beispielsweise nah aneinander liegende SNP-Stellen erfassen, oder man kann eine Kontrolle einer SNP-Stelle in beiden Strängen vornehmen.Primers can be used for both strands of a double-strand NSK. This makes it possible, for example, to record SNP points that are close to one another, or to check an SNP point in both lines.
Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 10-30 oder 30-40 oder 40-50. Für verschiedene SNP-Stellen, bzw. Zielsequenzen können Primer mit unterschiedlicher Länge eingesetzt werden.The length of the primer is preferably between 6 and 100 NTs, optimally between 10-30 or 30-40 or 40-50. Primers with different lengths can be used for different SNP sites or target sequences.
Für die SNP-Analyse mit sequenzspezifischen Primern werden Primer erfindungsgemäß in einer Hybridisierungslösung an die auf der Reaktionsoberfläche immobilisierten NSKFs hybridisiert (Annealing-Reaktion) .For the SNP analysis with sequence-specific primers, primers are hybridized according to the invention in a hybridization solution to the NSKFs immobilized on the reaction surface (annealing reaction).
c) Immobilisierung von NSKFsc) Immobilization of NSKFs
In dieser Ausführungform werden erfindungsgemäß die NSKF- Primer-Komplexe ausschließlich über die NSKFs an die Oberfläche gebunden (direkte Bindung von NSKFs an die Oberfläche) , wobei die bereitgestellten NSKF-Moleküle an die plane Oberfläche in zufälliger Anordnung gebunden werden.In this embodiment, the NSKF primer complexes are bound to the surface exclusively via the NSKFs (direct binding of NSKFs to the Surface), the NSKF molecules provided being bound to the flat surface in a random arrangement.
Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem der beiden Ketten-Enden (s.o.). Die Immobilisierung kann auch durch eine unspezifische Bindung, wie z.B. durch Austrocknung der NSKFs enthaltenden Probe auf der planen Oberfläche erreicht werden. Die Dichte der Immobilisation kann zwischen 10 und 100, 100 und 10.000, 10.000 und 1.000.000 NSKFs pro 100 μm2 liegen.The NSKFs are preferably immobilized at one of the two chain ends (see above). The immobilization can also be achieved by a non-specific binding, for example by drying out the sample containing NSKFs on the flat surface. The density of the immobilization can be between 10 and 100, 100 and 10,000, 10,000 and 1,000,000 NSKFs per 100 μm 2 .
d) Hybridisierungd) hybridization
Die gebundenen NSKFs und die Primer werden unter stringenten Hybridisierungsbedingungen inkubiert, die eine möglichst selektive Anbindung (Annealing) der Primer an die entsprechenden Primerbindungsstellen der NSKFs erlauben. Optimale Hybridisierungsbedingungen hängen von der genauen Struktur der Primerbindungsstellen und der jeweiligen Primerstrukturen ab und lassen sich beispielsweise nach Rychlik et al . NAR 1990 v.18 S.6409 berechnen.The bound NSKFs and the primers are incubated under stringent hybridization conditions which allow the primers to be linked as selectively as possible (annealing) to the corresponding primer binding sites of the NSKFs. Optimal hybridization conditions depend on the exact structure of the primer binding sites and the respective primer structures and can be determined, for example, according to Rychlik et al. Calculate NAR 1990 v.18 p.6409.
Die Primer stellen vorzugsweise ein Primergemisch dar. Die Konzentrationen einzelner sequenzspezifischer Primer (Einzelkonzentrationen von Primer-Populationen) liegen beispielsweise zwischen 10pmol/l und lmmol/1, vorzugsweise zwischen 0.1μmol/l und 10μmol/l. Die Gesamtkonzentration von Primern im Primergemisch liegt vorzugsweise zwischen lnmol/1 und 10mmol/l. Das Verhältnis zwischen einzelnen Primer- Populationen kann variieren. Primer können in deutlichem Überschuss über die immobilisierten NSKFs zugegeben werden, so dass die Hybridisierungszeit gering ist.The primers are preferably a mixture of primers. The concentrations of individual sequence-specific primers (individual concentrations of primer populations) are, for example, between 10 pmol / l and 1 mmol / 1, preferably between 0.1 μmol / l and 10 μmol / l. The total concentration of primers in the primer mixture is preferably between 1 mol / 1 and 10 mmol / l. The ratio between individual primer populations can vary. Primers can be added in a significant excess over the immobilized NSKFs, so that the hybridization time is short.
Die für die Detektion notwendige Dichte von extensionsfähigen NSKF-Primer-Komplexen beträgt ca. 10 bis 100 pro 100 μm2. Sie kann vor, während oder nach der Hybridisierung der Primer erreicht werden. Bei einer bekannten NSKF-Konzentration können in einer Ausführungsform die Immobilisierungsbedingungen so gewählt werden, dass die NSKFs in einer Dichte von ca. 10 bis 1000 Moleküle pro lOOμm2 gebunden werden. NSKFs bestimmen somit die Dichte der NSKF-Primer-Komplexe.The density of NSKF primer complexes which can be extended is necessary for the detection to be approximately 10 to 100 per 100 μm 2 . It can be achieved before, during or after hybridization of the primers. In the case of a known NSKF concentration, in one embodiment the immobilization conditions can be selected such that the NSKFs are bound in a density of approx. 10 to 1000 molecules per 100 μm 2 . NSKFs thus determine the density of the NSKF primer complexes.
In einer anderen Ausführungsform kann die Dichte der immobilisierten NSKFs wesentlich höher als 1000 NSKFs pro lOOμm2 liegen, z.B. 1.000.000 pro lOOμm2. Die für die optische Detektion notwendige Dichte der NSKF-Primer-Komplexe wird während der Primer-Hybridisierung erreicht. Dabei sind die Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer) so zu wählen, dass die Primer nur an einen Teil der immobilisierten NSKFs binden.In another embodiment, the density of the immobilized NSKFs can be substantially higher than 1000 NSKFs per 100 μm 2 , for example 1,000,000 per 100 μm 2 . The density of the NSKF primer complexes required for optical detection is achieved during the primer hybridization. The hybridization conditions (eg temperature, time, buffer) should be selected so that the primers only bind to a part of the immobilized NSKFs.
Bei unbekannter NSKF-Konzentration und entsprechend unbekannter Immobilisationsdichte kann die Hybridisierung (Annealing) von Primern an die NSKFs zu einer höheren als optimale Dichte von NSKF-Primer-Komplexen führen.If the NSKF concentration is unknown and the immobilization density is accordingly unknown, the hybridization (annealing) of primers to the NSKFs can lead to a higher than optimal density of NSKF-primer complexes.
Aus diesem Grund wird in einer vorteilhaften Ausführungsform ein Teil der NSKFs enthaltenden Probe für die Ermittlung der optimalen Dichte verwendet. Dieser Teil wird auf einer Reaktionsoberfläche immobilisiert, die Primer werden an die NSKFs hybridisiert und die entstandenen NSKF-Primer-Komplexe werden durch den Einbau von Fluoreszenzfarbstoff tragenden NT*s (z.B. Cy3-dCTP, Amersham Pharmacia Biotech) markiert. Aus der ermittelten Dichte lässt sich einerseits die eventuell notwendige Verdünnung oder Konzentrierung der ursprünglichen Probe für den endgültigen Sequenzierungsansatz errechnen (Die Hybridisierungsbedingungen werden beibehalten) . Andererseits können daraus notwendige Veränderungen in den Hybridisierungsbedingungen errechnet werden, beispielsweise eine Verkürzung der Hybridisierungszeit, wobei die NSKF-Immobilisierungsdichte konstant bleibt. Das Mengen-Verhältnis zwischen Primerpopulationen kann unterschiedlich oder gleich groß sein. Durch eine höhere Primerkonzentrationen können gewisse, beispielsweise seltenere Sequenzen mit größerer Wahrscheinlichkeit in einem bestimmten Zeitraum gebunden werden.For this reason, in an advantageous embodiment, part of the sample containing NSKFs is used to determine the optimal density. This part is immobilized on a reaction surface, the primers are hybridized to the NSKFs and the resulting NSKF-primer complexes are marked by the incorporation of fluorescent dye-bearing NT * s (eg Cy3-dCTP, Amersham Pharmacia Biotech). On the one hand, the density determined can be used to calculate the dilution or concentration of the original sample that may be necessary for the final sequencing approach (the hybridization conditions are maintained). On the other hand, necessary changes in the hybridization conditions can be calculated from this, for example a shortening of the hybridization time, the NSKF immobilization density remaining constant. The quantity ratio between primer populations can be different or the same size. A higher primer concentration makes it possible to bind certain, for example rarer, sequences with a higher probability in a certain period of time.
Der große Vorteil der beschriebenen Verfahrensanordnung gegenüber einer Verfahrensanordnung mit auf einer Oberfläche immobilisierten sequenzspezifischen Primern und einer anschließenden Hybridisierung von Proben an diese Primer ist die deutliche Verkürzung der Zeit für die Hybridisierung (Annealing) zwischen den sequenzspezifischen Primern und den zu analysierenden Proben auf der Reaktionsoberfläche.The great advantage of the described process arrangement compared to a process arrangement with sequence-specific primers immobilized on a surface and a subsequent hybridization of samples to these primers is the significant reduction in the time for hybridization (annealing) between the sequence-specific primers and the samples to be analyzed on the reaction surface.
Legenden zu Figuren 1 bis 8Legends for Figures 1 to 8
Legende zu Fig. 1Legend to Fig. 1
Schematische Darstellung der Sequenzierng einer langen NukleinsäureketteSchematic representation of the sequencing of a long nucleic acid chain
Der Sequenzierung und der Rekonstruktion von langen Nukleinsäuresequenzen (NSKs) liegt das Shotgun-Prinzip zugrunde. Die Sequenz eines langen DNA-Stücks wird dabei durch die Sequenzierung kleiner Fragmente (NSKFs) und eine nachfolgende Rekonstruktion ermittelt.The sequencing and reconstruction of long nucleic acid sequences (NSKs) is based on the shotgun principle. The sequence of a long piece of DNA is determined by sequencing small fragments (NSKFs) and a subsequent reconstruction.
1) Ausgangsmaterial - die zu analysierende lange Nukleinsäurensequenz , Gesamtsequenz1) Starting material - the long nucleic acid sequence to be analyzed, total sequence
2) Fragmente von 50-1000 bp - die im Fragmentierungsschritt aus der Gesamtsequenz erzeugten NSKFs2) Fragments of 50-1000 bp - the NSKFs generated from the total sequence in the fragmentation step
3) Fragmente mit jeweils einem Primer - NSKF-Primer-Komplexe3) Fragments with one primer each - NSKF-primer complexes
4) Immobilisierte Fragmente - an die plane Oberfläche gebundene NSKF-Primer-Komplexe, in dieser Ausführungsform erfolgt die Bindung am 3 -Ende der NSKFs4) Immobilized fragments - on the flat surface bound NSKF primer complexes, in this embodiment the binding takes place at the 3 end of the NSKFs
5) Zugabe einer Lösung mit Polymerasen und NT*s - der erste Schritt in einem Zyklus der Sequenzierungsreaktion5) Add a solution with polymerases and NT * s - the first step in a cycle of the sequencing reaction
6) Waschschritt - nach dem Einbauschritt wird die Oberfläche gewaschen6) Washing step - after the installation step, the surface is washed
7) Detektion - die Signale von einzelnen eingebauten NT*s werden detektiert7) Detection - the signals from individual built-in NT * s are detected
8) Entfernung der Markierung und der zur Termination führenden Gruppe8) Remove the marker and the group leading to the termination
Legende zur Fig. 2Legend for Fig. 2
Beispiele für allgemeine Struktur von NSKF-Primer-KomplexenExamples of general structure of NSKF primer complexes
In dieser Ausführungsform wird eine einheitliche Primerbindungsstelle (PBS) an das 3 '-Ende der NSKFs angekoppelt und an diese PBS bindet ein einheitlicher Primer.In this embodiment, a uniform primer binding site (PBS) is coupled to the 3 'end of the NSKFs and a uniform primer binds to this PBS.
Legende zur Fig. 3Legend for Fig. 3
Ein Beispiel für die Ankopplung einer einheitlichen Primerbindungsstelle (PBS) , die eine funktionelle Gruppe zur Bindung an die Oberfläche trägt.An example of the coupling of a uniform primer binding site (PBS), which carries a functional group for binding to the surface.
In diesem Fall wird ein doppelsträngiger Oligonukleotidkomplex (3a) , der beispielsweise eine Modifikation an beiden Strängen hat (3b) , an die doppelsträngigen NSKFs liegiert (3c) . Nach Denaturierung entstehen einzelsträngige NSKFs mit einheitlicher PBS (3d) . Legende zur Fig. 4In this case, a double-stranded oligonucleotide complex (3a), which has, for example, a modification on both strands (3b), is located on the double-stranded NSKFs (3c). After denaturation, single-strand NSKFs with uniform PBS (3d) are created. Legend for Fig. 4
Ein anderes Beispiel für die Erzeugung einer einheitlichen Primerbindungsstelle (PBS) .Another example of the creation of a uniform primer binding site (PBS).
In diesem Fall werden NTs an das 3 ' -Ende der einzelsträngigen NSKFs angekoppelt (ein so genanntes „Tailing"). Durch Verwendng eines einheitlichen NT entsteht eine einheitliche PBS.In this case, NTs are coupled to the 3 'end of the single-strand NSKFs (a so-called "tailing"). By using a uniform NT, a uniform PBS is created.
Legende zur Fig. 5Legend for Fig. 5
Beispiel für die Bindung von NSKFs an eine gelartige ReaktionsOberfläche .Example of the binding of NSKFs to a gel-like reaction surface.
Auf einer festen Unterlage (1) haftet eine Gelschicht (2), z.B. ein Polyacrylamidgel (Fig. 5a), oder haften viele Gelkügelchen (5), z.B. Agarosekügelchen (Fig. 5b). An die Oberfläche des Gels sind NSKFs (4) gebunden. Die NSKFs tragen eine funktionelle Gruppe, z.B. Biotin, und sind an das Gel über Streptavidin oder Avidin (3) gebunden.A gel layer (2) adheres to a solid base (1), e.g. a polyacrylamide gel (Fig. 5a), or many gel beads (5), e.g. Agarose beads (Fig. 5b). NSKFs (4) are bound to the surface of the gel. The NSKFs have a functional group, e.g. Biotin, and are bound to the gel via streptavidin or avidin (3).
Legende zur Fig. 6Legend for Fig. 6
Beispiel für eine DurchflussvorrichtungExample of a flow device
Eine gelartige Reaktionsoberfläche ( 1) ist auf einer für das Anregungs- und Fluoreszenzlicht durchlässige festen Unterlage ( 2 ) befestigt . Sie bilden zusammen den Deckel der Flow-Cell . Die Flüssigkeiten in der Flow-Cell können kontrolliert ausgetauscht werden, wobei die Flow-Cell zusammen mit Vorratsbehälter ( 3) , Pumpe ( 4 ) und Ventil ( 5) eine Durchflussvorrichtung bilden . Auf der Reaktionsoberfläche sind NSKF-Primer-Komplexe gebunden (hier nicht abgebildet) . Die Signale der eingebauten NT*s werden mit der Detektionsapparatur (6) detektiert.A gel-like reaction surface (1) is attached to a solid base (2) which is permeable to the excitation and fluorescent light. Together they form the lid of the flow cell. The liquids in the flow cell can be exchanged in a controlled manner, the flow cell forming a flow device together with the reservoir (3), pump (4) and valve (5). NSKF primer complexes are bound to the reaction surface (not shown here). The signals of the installed NT * s are detected with the detection apparatus (6).
Legende zur Fig. 7Legend for Fig. 7
Schematische Darstellung der Analyse von mRNA-PopulationSchematic representation of the analysis of mRNA population
Der Analyse liegt die Sequenzierung kurzer Abschnitte von mRNA zugrunde .The analysis is based on the sequencing of short sections of mRNA.
1) mRNA - die zu analysierende mRNA-Population, in diesem Beispiel bestehend aus zwei unterschiedlichen mRNA- Molekülpopulationen (dünne und dicke Streifen repräsentieren mRNA-Moleküle)1) mRNA - the mRNA population to be analyzed, in this example consisting of two different mRNA molecule populations (thin and thick strips represent mRNA molecules)
2) Immobilisierte mRNA - an die plane Oberfläche gebundene mRNA-Primer-Komplexe, in diesem Beispiel erfolgt die Bindung durch die Oligo-dT-Primer2) Immobilized mRNA - mRNA-primer complexes bound to the flat surface, in this example the binding is carried out by the oligo-dT primer
3) Zugabe einer Lösung mit Polymerasen und NT*s - der erste Schritt in einem Zyklus der Sequenzierungsreaktion3) Add a solution with polymerases and NT * s - the first step in a cycle of the sequencing reaction
4) Waschschritt - nach dem Einbauschritt wird die Oberfläche gewaschen4) Washing step - after the installation step, the surface is washed
5) Detektion - die Signale von einzelnen eingebauten NT*s werden detektiert5) Detection - the signals from individual built-in NT * s are detected
6) Entfernung der Markierung und der zur Termination führenden Gruppe6) Remove the marker and the group leading to the termination
Legende zur Fig. 8Legend for Fig. 8
Beispiel für ein DetektionssystemExample of a detection system
Dargestellt ist ein Weitfeld-Optik-Detektionssystem. Nach dem Einbau von markierten NT*s wird die Oberfläche (7) abgescannt, wobei die Fluoreszenzsignale von einzelnen, an die NTs gekoppelten Farbstoffmolekülen detektiert werden.A wide-field optical detection system is shown. After installing marked NT * s, the surface (7) scanned, the fluorescence signals being detected by individual dye molecules coupled to the NTs.
Fig. 8a Schematische Darstellung eines Abschnittes der Reaktionsoberfläche (grau) , der abgescannt wird. Die Kreise entsprechen jeweils der Aufnahme eines 2D-Bildes und repräsentieren die Flächen, von denen die Fluoreszenzsignale detektiert werden. Dabei werden pro Aufnahme mehrere Signale (beispielsweise 100 bis 10.000) von einzelnen Molekülen gleichzeitig registriert. Die Reaktionsoberfläche wird in jedem Zyklus abgescannt, wobei während des Scannvorganges mehrere Aufnahmen von unterschiedlichen Stellen der Oberfläche gemacht werden. Dabei können bis zu mehreren Millionen Signale von eingebauten NT*s aufgenommen werden. Die hohe Parallelität ist die Grundlage für die Geschwindigkeit des Verfahrens.Fig. 8a Schematic representation of a portion of the reaction surface (gray) that is scanned. The circles each correspond to the recording of a 2D image and represent the areas from which the fluorescence signals are detected. Several signals (for example 100 to 10,000) of individual molecules are registered simultaneously per exposure. The reaction surface is scanned in each cycle, several images being taken from different locations on the surface during the scanning process. Up to several million signals can be recorded by built-in NT * s. The high degree of parallelism is the basis for the speed of the process.
Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von einzelnen, eingebauten NT*s.Fig. 8b A recording (a 2D image) with signals from individual, built-in NT * s.
Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt Signale von vier eingebauten NT*s. Jedes Signal besitzt charakteristische Eigenschaften der Einzelmolekülsignale (s. Beschreibung) und kann auf grund dieser identifiziert werden (vorzugsweise mit Hilfe eines Computer-Programms) . Jedem der identifizierten Signale werden die entsprechenden X,Y- Koordinaten zugeordnet. Fig. 8c detail from Figure 8b. The section shows signals from four built-in NTs. Each signal has characteristic properties of the single molecule signals (see description) and can be identified on the basis of these (preferably with the aid of a computer program). The corresponding X, Y coordinates are assigned to each of the identified signals.

Claims

Patentansprüche; claims;
1. Verfahren zur parallelen Sequenzanalyse von Nukleinsäuresequenzen (Nukleinsäureketten, NSKs) , bei dem man1. Method for parallel sequence analysis of nucleic acid sequences (nucleic acid chains, NSKs), in which one
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen einer Gesamtsequenz darstellen können, manGenerated fragments (NSKFs) of single-stranded NSKs with a length of about 50 to 1000 nucleotides, which can represent overlapping partial sequences of an entire sequence
die NSKFs unter Verwendung eines einheitlichen oder mehrerer unterschiedlichen Primer in Form von NSKF-Primer- Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, manthe NSKFs are bound on a reaction surface in a random arrangement using one or more different primers in the form of NSKF-primer complexes
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung einer oder mehrerer Polymerasen durchführt, indem mancyclically build the complementary strand of the NSKFs using one or more polymerases by
a) zu den auf der Oberfläche gebundenen NSKF-Primer- Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* an der 3 ' - Position strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent und der Fluoreszenzfarbstoff abspaltbar ist, man b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, mana) a solution is added to the NSKF primer complexes bound to the surface, which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * Fluorescent dyes located on each of the NTs * are selected such that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * at the 3 'position being structurally modified such that the polymerase after incorporation of such an NT * in a growing complementary strand is unable to incorporate a further NT * into the same strand, the terminating substituent and the fluorescent dye being removable, man b) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
e) zur Erzeugung unmarkierter (NTs oder) NSKFs die zur Termination führenden Substituenten und die Fluoreszenzfarbstoffe von den am komplementären Strang angefügten NTs* abspaltet, mane) to generate unlabeled (NTs or) NSKFs, the substituents leading to the termination and the fluorescent dyes are cleaved off from the NTs * attached to the complementary strand, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner NSKF-Primer- Komplexe auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt . the relative position of individual NSKF-primer complexes on the reaction surface and the sequence of these NSKFs being determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils ein markiertes NT* einsetzt.2. The method according to claim 1, characterized in that steps a) to f) of the cyclic reaction are repeated several times, only one marked NT * being used in each cycle.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* einsetzt.3. The method according to claim 1, characterized in that the steps a) to f) of the cyclic reaction are repeated several times, using two differently labeled NTs * in each cycle.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils vier unterschiedlich markierte NTs* einsetzt.4. The method according to claim 1, characterized in that the steps a) to f) of the cyclic reaction are repeated several times, using four differently marked NTs * in each cycle.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die NSKs Varianten einer bekannten Referenzsequenz sind und man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die GesamtSequenzen durch Vergleich mit der Referenzsequenz ermittelt.5. The method according to claim 1, characterized in that the NSKs are variants of a known reference sequence and steps a) to f) of the cyclic reaction are repeated several times, alternately using two differently marked NTs * and two unmarked NTs in the cycles and the total sequences are determined by comparison with the reference sequence.
6. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekennzeichnet, dass man in die NSKFs jeweils eine Primerbindungsstelle (PBS) einführt, wobei man bei doppelsträngigen NSKs an beiden komplementären Einzelsträngen jeweils eine PBS einführt und wobei die Primerbindungsstellen für alle NSKFs jeweils gleiche oder verschiedene Sequenzen aufweisen.6. The method according to claims 1 to 5, characterized in that in each case a primer binding site (PBS) is introduced into the NSKFs, wherein in the case of double-stranded NSKs one PBS is introduced on each of two complementary single strands and the primer binding sites are the same or different for all NSKFs Have sequences.
7. Verfahren nach den Ansprüchen 1 bis 6 , dadurch gekennzeichnet, dass man die NSKFs mit Primern in einer Lösung unter Bedingungen in Kontakt bringt, die zur Hybridisie- rung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen, und man die gebildeten NSKF-Primer-Komplexe anschließend auf der Reaktionsoberfläche bindet .7. The method according to claims 1 to 6, characterized in that the NSKFs are brought into contact with primers in a solution under conditions which lead to hybridization. tion of the primers to the primer binding sites (PBSs) of the NSKFs are suitable, the primers having identical or different sequences to one another, and the NSKF-primer complexes formed are then bound to the reaction surface.
8. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekennzeichnet, dass man die NSKFs zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei NSKF-Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.8. The method according to claims 1 to 6, characterized in that the NSKFs are first immobilized on the reaction surface and only then brought into contact with primers under conditions which are suitable for hybridizing the primers to the primer binding sites (PBSs) of the NSKFs, wherein NSKF primer complexes are formed, the primers having the same or different sequences.
9. Verfahren nach den Ansprüchen 1 bis 6 , dadurch gekennzeichnet, dass man die Primer zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit NSKFs unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen9. The method according to claims 1 to 6, characterized in that the primers are first immobilized on the reaction surface and only then brought into contact with NSKFs under conditions which hybridize the primers to the primer binding sites
(PBSs) der NSKFs geeignet sind, wodurch NSKFs an die Oberfläche gebunden und NSKF-Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.(PBSs) of the NSKFs are suitable, as a result of which NSKFs are bound to the surface and NSKF-primer complexes are formed, the primers having identical or different sequences to one another.
10. Verfahren nach den Ansprüchen 1 bis 9, dadurch gekennzeichnet, dass die Dichte der extensionsfähigen10. The method according to claims 1 to 9, characterized in that the density of the expandable
NSKF-Primer-Komplexe zwischen etwa 10 und 100 pro lOOμm2 liegt .NSKF primer complexes is between about 10 and 100 per 100 μm 2 .
11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Nukleinsäuresequenzen (NSKs) Sequenzabschnitte einer Gesamtsequenz sind und die Primer sequenzspezifische Primer sind, wobei man einzelsträngige NSKFs mit einer Länge von etwa 30 bis 1000 Nukleotiden bereitstellt, die überlappenden Teilsequenzen der Gesamtsequenz entsprechen, man11. The method according to claim 1, characterized in that the nucleic acid sequences (NSKs) are sequence sections of an entire sequence and the primers are sequence-specific primers, wherein one provides single-stranded NSKFs with a length of about 30 to 1000 nucleotides, which correspond to overlapping partial sequences of the entire sequence
die NSKF-Moleküle direkt an einer planen Oberfläche in einer zufälligen Anordnung bindet, manthe NSKF molecules bind directly to a flat surface in a random arrangement, one
mit einer oder mehreren sequenzspezifischen Primerpopulationen eine Hybridisierung (Annealing) an die immobilisierten NSKFs durchführt, wobei die Dichte der einzelnen extensionsfähigen NSKF-Primer-Komplexe zwischen 10 und 100 pro lOOμm2 liegt, manhybridization (annealing) to the immobilized NSKFs is carried out with one or more sequence-specific primer populations, the density of the individual NSKF-primer complexes capable of extension being between 10 and 100 per 100 μm 2
eine zyklische Aufbaureaktion der zu NSKFs komplementären Stränge durchführt, indem manperforms a cyclic build-up reaction of the strands complementary to NSKFs by
a) zu den gebundenen NSKF-Primer-Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* an der 3 ' -Position strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent und der Fluoreszenzfarbstoff abspaltbar ist, mana) a solution is added to the bound NSKF-primer complexes, which contains one or more polymerases and one to four modified nucleotides (NTs * ), which are labeled with fluorescent dyes, with the simultaneous use of at least two NTs * each on the Fluorescent dyes located in NTs * are selected such that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * at the 3 'position being structurally modified so that the polymerase after incorporation of such an NT * into a growing complementary one Strand is unable to incorporate another NT * into the same strand, the terminating substituent and the fluorescent dye being cleavable
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, man c) die in Stufe b) erhaltenen stationären Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manb) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man c) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated in a complementary strand
e) die einzelnen, in komplementäre Stränge eingebauten NT*-Moleküle durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, mane) the individual NT * molecules built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
e) die zur Termination führenden Substituenten und die Fluoreszenzfarbstoffe von den am komplementären Strang angefügten NTs* zur Erzeugung unmarkierter (NTs oder) NSKFs abspaltet, mane) the substituents leading to the termination and the fluorescent dyes are cleaved from the NTs * attached to the complementary strand to produce unlabelled (NTs or) NSKFs, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der zu Termination führenden Gruppen mit den Fluoreszenzfarbstoffen geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the groups leading to termination with the fluorescent dyes
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner NSKF-Primer- Komplexe auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt .the relative position of individual NSKF-primer complexes on the reaction surface and the sequence of these NSKFs being determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs.
12. Verfahren zur hoch parallelen Analyse der Genexpression bei dem man einzelsträngige Genprodukte bereitstellt, man12. Method for highly parallel analysis of gene expression in which one provides single-stranded gene products, one
die Genprodukte unter Verwendung eines einheitlichen oder mehrerer unterschiedlichen Primer in Form von Genprodukt- Primer-Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, manthe gene products are bound on a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes, one
eine zyklische Aufbaureaktion des komplementären Stranges der Genprodukte unter Verwendung einer oder mehrerer Polymerasen durchführt , indem manperform a cyclic assembly reaction of the complementary strand of the gene products using one or more polymerases by
a) zu den auf der Oberfläche gebundenen Genprodukt- Primer-Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* an der 3 ' - Position strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent und der Fluoreszenzfarbstoff abspaltbar ist, mana) a solution is added to the gene product-primer complexes bound to the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * Fluorescent dyes located on each of the NTs * are selected such that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * at the 3 'position being structurally modified such that the polymerase after incorporation of such an NT * in a growing complementary strand is unable to incorporate a further NT * into the same strand, the terminating substituent and the fluorescent dye being removable, man
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) below Conditions that are not suitable for the removal of NTs * built into a complementary strand, one
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktions- Oberfläche bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal which is characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte die zur Termination führenden Substituenten und die Fluoreszenzfarbstoffe von den am komplementären Strang angefügten NTs* abspaltet, mane) to generate unlabelled (NTs or) gene products, the substituents leading to the termination and the fluorescent dyes are cleaved from the NTs * attached to the complementary strand, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner Genprodukt- Primer-Komplexe auf der Reaktionsoberfläche und die Sequenz dieser Genprodukte durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten Teilsequenzen die Identität der Genprodukte bestimmt.whereby the relative position of individual gene product-primer complexes on the reaction surface and the sequence of these gene products are determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs and the identity of the gene products is determined from the partial sequences determined certainly.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils ein markiertes NT* einsetzt.13. The method according to claim 12, characterized in that steps a) to f) of the cyclic reaction are repeated several times, only one marked NT * being used in each cycle.
14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* einsetzt.14. The method according to claim 12, characterized in that stages a) to f) of the cyclic reaction are repeated several times, with two differently marked NTs * being used in each cycle.
15. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils vier unterschiedlich markierte NTs* einsetzt.15. The method according to claim 12, characterized in that steps a) to f) of the cyclic reaction are repeated several times, using four differently marked NTs * in each cycle.
16. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass bereits bekannte Gene als Referenzsequenzen dienen und man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Identität der Genprodukte durch Vergleich der gewonnenen Sequenzen mit denen der Referenzsequenzen ermittelt.16. The method according to claim 12, characterized in that already known genes serve as reference sequences and steps a) to f) of the cyclic reaction are repeated several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and the identity of the gene products is determined by comparing the sequences obtained with those of the reference sequences.
17. Verfahren nach den Ansprüchen 12 bis 16, dadurch gekennzeichnet, dass man in die Genprodukte jeweils eine Primerbindungsstelle (PBS) einführt, wobei die Primerbindungsstellen für alle Genprodukte jeweils gleiche oder verschiedene Sequenzen aufweisen.17. The method according to claims 12 to 16, characterized in that in each case a primer binding site (PBS) is introduced into the gene products, the primer binding sites each having the same or different sequences for all gene products.
18. Verfahren nach den Ansprüchen 12 bis 17, dadurch gekennzeichnet, dass man die Genprodukte mit Primern in einer Lösung unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen18. The method according to claims 12 to 17, characterized in that the gene products are brought into contact with primers in a solution under conditions which hybridize the primers to the primer binding sites
(PBSs) der Genprodukte geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen, und man die gebildeten Genprodukt-Primer- Komplexe anschließend auf der Reaktionsoberfläche bindet .(PBSs) of the gene products are suitable, the primers having identical or different sequences to one another, and the gene product-primer complexes formed are then bound to the reaction surface.
19. Verfahren nach den Ansprüchen 12 bis 17, dadurch gekennzeichnet, dass man die Genprodukte zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der Genprodukte geeignet sind, wobei Genprodukt- Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.19. The method according to claims 12 to 17, characterized in that the gene products are first immobilized on the reaction surface and only then brought into contact with primers under conditions which lead to Hybridization of the primers to the primer binding sites (PBSs) of the gene products are suitable, gene product-primer complexes being formed, the primers having identical or different sequences to one another.
20. Verfahren nach den Ansprüchen 12 bis 17, dadurch gekennzeichnet, dass man die Primer zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit Genprodukten unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen20. The method according to claims 12 to 17, characterized in that the primers are first immobilized on the reaction surface and only then brought into contact with gene products under conditions which hybridize the primers to the primer binding sites
(PBSs) der Genprodukte geeignet sind, wodurch Genprodukte an die Oberfläche gebunden und Genprodukt-Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.(PBSs) of the gene products are suitable, as a result of which gene products are bound to the surface and gene product-primer complexes are formed, the primers having identical or different sequences to one another.
21. Verfahren nach den Ansprüchen 12 bis 20, dadurch gekennzeichnet, dass die Dichte der extensionsfähigen Genprodukt-Primer-Komplexe zwischen etwa 10 und 100 pro lOOμm2 liegt.21. The method according to claims 12 to 20, characterized in that the density of the extensible gene product-primer complexes is between about 10 and 100 per lOOμm 2 .
22. Verfahren nach Ansprüchen 1 bis 21 dadurch gekennzeichnet, dass der Fluoreszenzfarbstoff zusammen mit dem zur Termination führenden Substituenten abgespalten wird.22. The method according to claims 1 to 21, characterized in that the fluorescent dye is split off together with the substituent leading to the termination.
23. Verfahren nach Ansprüchen 1 bis 21 dadurch gekennzeichnet, dass zunächst der Fluoreszenzfarbstoff abgespalten wird und erst danach der zur Termination führende Substituent abgespalten wird.23. The method according to claims 1 to 21, characterized in that the fluorescent dye is first split off and only then the substituent leading to the termination is split off.
24. Verfahren nach Ansprüchen 1 bis 21, dadurch gekennzeichnet, dass man im Detektionsschritt (d) folgende Detektionsarten einsetzt: Weitfeld- Epifluoreszenzmikroskopie , Laser-Scanning- Fluoreszenzmikroskopie , TIRF-Mikroskopie .24. The method according to claims 1 to 21, characterized in that the following types of detection are used in detection step (d): wide-field epifluorescence microscopy, laser scanning Fluorescence microscopy, TIRF microscopy.
25. Verfahren nach den Ansprüchen 1 oder 11, dadurch gekennzeichnet, dass es ein Verfahren zur SNP-Analyse ist und man einen sequenzspezifischen Primer zur Identifizierung jeder SNP-Stelle in der Gesamtsequenz verwendet .25. The method according to claims 1 or 11, characterized in that it is a method for SNP analysis and one uses a sequence-specific primer to identify each SNP site in the total sequence.
26. Verfahren nach Anspruch 25, dadurch gekennzeichnet, dass die Zahl der parallel zu analysierenden SNP-Stellen größer als 2 ist und man für jede SNP-Stelle einen sequenzspezifischen Primer verwendet .26. The method according to claim 25, characterized in that the number of SNP sites to be analyzed in parallel is greater than 2 and a sequence-specific primer is used for each SNP site.
27. Verfahren nach den Ansprüchen 1 bis 26, dadurch gekennzeichnet, dass die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist .27. The method according to claims 1 to 26, characterized in that the reaction surface is selected from the group consisting of silicone, glass, ceramic, plastics, gels.
28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass die Kunststoffe Polycarbonate oder Polystyrole oder Derivate derselben sind.28. The method according to claim 27, characterized in that the plastics are polycarbonates or polystyrenes or derivatives thereof.
29. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass die Gele Agarose- oder Polyacrylamidgele oder Derivate derselben sind.29. The method according to claim 27, characterized in that the gels are agarose or polyacrylamide gels or derivatives thereof.
30. Verfahren nach Anspruch 29, dadurch gekennzeichnet, dass die Gele 1 bis 2 % Agarose-Gele oder 10 bis 15 % Polyacrylamid-Gele sind.30. The method according to claim 29, characterized in that the gels are 1 to 2% agarose gels or 10 to 15% polyacrylamide gels.
31. Verfahren nach den Ansprüchen 1 bis 30, dadurch gekennzeichnet, dass die Polymerase eine DNA-Polymerase ohne 3 ' -5 ' -Exonukleaseaktivität ist .31. The method according to claims 1 to 30, characterized in that the polymerase is a DNA polymerase without 3 '-5' exonuclease activity.
32. Verfahren nach Anspruch 31, dadurch gekennzeichnet, daß die Polymerase aus der Gruppe bestehend aus viralen DNA- Polymerasen vom Sequenase-Typ, bakteriellen thermolabilen und thermostabilen DNA-Polymerasen, DNA- Polymerasen Beta aus Eukaryonten und Reversen- Transkriptasen ausgewählt ist .32. The method according to claim 31, characterized in that the polymerase from the group consisting of viral DNA polymerases of the sequenase type, bacterial thermolabile and thermostable DNA polymerases, DNA polymerases beta from eukaryotes and reverse transcriptases is selected.
33. Verfahren nach den Ansprüchen 1 bis 32, dadurch gekennzeichnet, dass die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene, Porphyrine und deren Derivaten ausgewählt sind.33. The method according to claims 1 to 32, characterized in that the fluorescent dyes are selected from the group consisting of cyanine dyes, rhodamines, xanthenes, porphyrins and their derivatives.
34. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 33, dadurch gekennzeichnet, dass auf seiner Oberfläche die Nukleinsäureketten oder deren Fragmente in einer zufälligen Anordnung immobilisiert sind, wobei die Dichte der immobilisierten Nukleinsäureketten-Moleküle oder deren Fragmente zwischen 10 und 100 pro lOOμm2 liegt.34. Carrier for carrying out the method according to claims 1 to 33, characterized in that the nucleic acid chains or their fragments are immobilized on their surface in a random arrangement, the density of the immobilized nucleic acid chain molecules or their fragments between 10 and 100 per 100 μm 2 lies.
35. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 33, dadurch gekennzeichnet, dass auf seiner Oberfläche die Nukleinsäureketten oder deren Fragmente in einer zufälligen Anordnung immobilisiert sind, wobei die Dichte der immobilisierten Nukleinsäureketten-Moleküle oder deren Fragmente zwischen 100 und 1.000.000 pro lOOμm2 liegt.35. Carrier for carrying out the method according to claims 1 to 33, characterized in that the nucleic acid chains or their fragments are immobilized in a random arrangement on its surface, the density of the immobilized nucleic acid chain molecules or their fragments between 100 and 1,000,000 per lOOμm 2 .
36. Kit zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 35, dadurch gekennzeichnet, daß es eine Reaktionsoberfläche (einen festen Träger) , zur Durchführung des Verfahrens erforderliche Reaktionslösungen, ein oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die markierten NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*) , daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der zur Termination führende Substituent mit dem Fluoreszenzfarbstoff abspaltbar ist36. Kit for performing the method according to claims 1 to 35, characterized in that it contains a reaction surface (a solid support), reaction solutions required to carry out the method, one or more polymerases, and nucleotides (NTs), one of which is four are marked with fluorescent dyes, the marked NTs also being structurally modified (NT * or NTs * ) in such a way that the polymerase is incapable of incorporating such an NT * into a growing complementary strand is to install another NT * in the same strand, the terminating substituent being cleavable with the fluorescent dye
37. Kit nach Anspruch 36, dadurch gekennzeichnet, daß es ferner Bestandteile enthält :37. Kit according to claim 36, characterized in that it further contains components:
a) zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, b) Nukleinsäuremoleküle, die als PBS in die NSKFs eingeführt werden, c) Oligonukleotid-Primer, d) zur Abspaltung der Substituenten mit den Fluoreszenzfarbstoffen erforderliche Reagenzien, e) Waschlösungen.a) reagents required for the production of single strands from double strands, b) nucleic acid molecules which are introduced as PBS into the NSKFs, c) oligonucleotide primers, d) reagents required to split off the substituents with the fluorescent dyes, e) washing solutions.
38. Kit nach den Anspruch 36 oder 37, dadurch gekennzeichnet, daß die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.38. Kit according to claim 36 or 37, characterized in that the reaction surface is selected from the group consisting of silicone, glass, ceramic, plastics, gels.
39. Kit nach Anspruch 38, dadurch gekennzeichnet, daß die Gele Polyacrylamidgele sind.39. Kit according to claim 38, characterized in that the gels are polyacrylamide gels.
40. Kit nach Anspruch 39, dadurch gekennzeichnet, daß die Gele 5 bis 30% Polyacrylamid-Gele sind.40. Kit according to claim 39, characterized in that the gels are 5 to 30% polyacrylamide gels.
41. Kit nach den Ansprüchen 36 bis 40, dadurch gekennzeichnet, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'- 5 ' -Endonukleaseaktivität ist .41. Kit according to claims 36 to 40, characterized in that the DNA polymerase is a DNA polymerase without 3'- 5 'endonuclease activity.
42. Kit nach den Ansprüchen 36 bis 41, dadurch gekennzeichnet, daß die an die Nukleotide gekoppelten Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cya- nin-Farbstoffen, Rhodamine, Xanthene, Porphyrine und deren Derivaten ausgewählt sind. 42. Kit according to claims 36 to 41, characterized in that the fluorescent dyes coupled to the nucleotides are selected from the group consisting of cyanine dyes, rhodamines, xanthenes, porphyrins and their derivatives.
PCT/EP2002/009614 2001-08-29 2002-08-28 Method for analyzing nucleic acid sequences and gene expression WO2003020968A2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU2002337030A AU2002337030A1 (en) 2001-08-29 2002-08-28 Method for analyzing nucleic acid sequences and gene expression

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10142256.3 2001-08-29
DE10142256 2001-08-29

Publications (2)

Publication Number Publication Date
WO2003020968A2 true WO2003020968A2 (en) 2003-03-13
WO2003020968A3 WO2003020968A3 (en) 2003-12-31

Family

ID=7696956

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2002/009614 WO2003020968A2 (en) 2001-08-29 2002-08-28 Method for analyzing nucleic acid sequences and gene expression

Country Status (3)

Country Link
AU (1) AU2002337030A1 (en)
DE (1) DE10239504A1 (en)
WO (1) WO2003020968A2 (en)

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005044836A2 (en) 2003-11-05 2005-05-19 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
WO2005080605A2 (en) * 2004-02-19 2005-09-01 Helicos Biosciences Corporation Methods and kits for analyzing polynucleotide sequences
WO2005116262A1 (en) * 2004-05-24 2005-12-08 Helicos Biosciences Corporation Methods and devices for sequencing nucleic acids
WO2006007207A2 (en) * 2004-05-25 2006-01-19 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
EP1692312A2 (en) * 2003-11-12 2006-08-23 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
EP1694859A2 (en) * 2003-10-29 2006-08-30 Bioarray Solutions Ltd Multiplexed nucleic acid analysis by fragmentation of double-stranded dna
WO2007100637A2 (en) * 2006-02-22 2007-09-07 Helicos Biosciences Corporation Methods for mutation detection
US7645596B2 (en) 1998-05-01 2010-01-12 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
WO2011057061A1 (en) 2009-11-06 2011-05-12 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
EP2366801A1 (en) 2006-06-14 2011-09-21 Verinata Health, Inc Methods for the diagnosis of fetal abnormalities
WO2014026032A2 (en) 2012-08-08 2014-02-13 Apprise Bio, Inc. Increasing dynamic range for identifying multiple epitopes in cells
WO2015070086A1 (en) 2013-11-07 2015-05-14 The Board Of Trustees Of The Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
US9035035B2 (en) 2004-11-05 2015-05-19 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
US9051612B2 (en) 2006-09-28 2015-06-09 Illumina, Inc. Compositions and methods for nucleotide sequencing
WO2015089243A1 (en) 2013-12-11 2015-06-18 The Regents For Of The University Of California Methods for labeling dna fragments to recontruct physical linkage and phase
US9096898B2 (en) 1998-05-01 2015-08-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US9605310B2 (en) 2001-12-04 2017-03-28 Illumina Cambridge Limited Labelled nucleotides
US9637777B2 (en) 2003-10-28 2017-05-02 Bioarray Solutions, Ltd. Optimization of gene expression analysis using immobilized capture probes
US9670539B2 (en) 2007-10-19 2017-06-06 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US20170166961A1 (en) 2013-03-15 2017-06-15 Illumina Cambridge Limited Modified nucleosides or nucleotides
US9689032B2 (en) 2011-04-01 2017-06-27 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9709559B2 (en) 2000-06-21 2017-07-18 Bioarray Solutions, Ltd. Multianalyte molecular analysis using application-specific random particle arrays
US9715573B2 (en) 2015-02-17 2017-07-25 Dovetail Genomics, Llc Nucleic acid sequence assembly
US9718852B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
WO2017197300A1 (en) 2016-05-13 2017-11-16 Dovetail Genomics Llc Recovering long-range linkage information from preserved samples
US10072287B2 (en) 2009-09-10 2018-09-11 Centrillion Technology Holdings Corporation Methods of targeted sequencing
US10089437B2 (en) 2013-02-01 2018-10-02 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
WO2018195091A1 (en) 2017-04-18 2018-10-25 Dovetail Genomics, Llc Nucleic acid characteristics as guides for sequence assembly
US10144950B2 (en) 2011-01-31 2018-12-04 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
WO2018237209A1 (en) 2017-06-21 2018-12-27 Bluedot Llc Systems and methods for identification of nucleic acids in a sample
US10174368B2 (en) 2009-09-10 2019-01-08 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US10260094B2 (en) 2007-10-19 2019-04-16 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
WO2019152543A1 (en) 2018-01-31 2019-08-08 Dovetail Genomics, Llc Sample prep for dna linkage recovery
US10415081B2 (en) 2001-10-15 2019-09-17 Bioarray Solutions Ltd. Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
US10457934B2 (en) 2015-10-19 2019-10-29 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US10487102B2 (en) 2002-08-23 2019-11-26 Illumina Cambridge Limited Labelled nucleotides
US10513731B2 (en) 2002-08-23 2019-12-24 Illumina Cambridge Limited Modified nucleotides
US10526641B2 (en) 2014-08-01 2020-01-07 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
US10648026B2 (en) 2013-03-15 2020-05-12 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10722858B2 (en) 2013-03-15 2020-07-28 Lineage Biosciences, Inc. Methods and compositions for tagging and analyzing samples
US10975417B2 (en) 2016-02-23 2021-04-13 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
US10995111B2 (en) 2003-08-22 2021-05-04 Illumina Cambridge Limited Labelled nucleotides
WO2021103695A1 (en) * 2019-11-25 2021-06-03 齐鲁工业大学 Single-base continuous extension flow-type targeted sequencing method
EP3836149A1 (en) 2011-11-07 2021-06-16 QIAGEN Redwood City, Inc. Methods and systems for identification of causal genomic variants
US11098353B2 (en) 2006-12-01 2021-08-24 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US11166996B2 (en) 2018-12-12 2021-11-09 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use
US11781959B2 (en) 2017-09-25 2023-10-10 Freenome Holdings, Inc. Methods and systems for sample extraction
US11807896B2 (en) 2015-03-26 2023-11-07 Dovetail Genomics, Llc Physical linkage preservation in DNA storage

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2288760T3 (en) 1996-04-25 2008-01-16 Bioarray Solutions Ltd. ELECTROCINETIC ASSEMBLY CONTROLLED BY LIGHT OF PARTICLES NEXT TO SURFACES.
US7262063B2 (en) 2001-06-21 2007-08-28 Bio Array Solutions, Ltd. Directed assembly of functional heterostructures
WO2004047007A1 (en) 2002-11-15 2004-06-03 Bioarray Solutions, Ltd. Analysis, secure access to, and transmission of array images
ES2375962T3 (en) 2003-09-22 2012-03-07 Bioarray Solutions Ltd IMMOBILIZED SURFACE POLYELECTROLYTE WITH MULTIPLE FUNCTIONAL GROUPS ABLE TO JOIN COVALENTLY TO BIOMOLECULES.
US7848889B2 (en) 2004-08-02 2010-12-07 Bioarray Solutions, Ltd. Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993005183A1 (en) * 1991-09-09 1993-03-18 Baylor College Of Medicine Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme
WO1993021340A1 (en) * 1992-04-22 1993-10-28 Medical Research Council Dna sequencing method
US5302509A (en) * 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
US5547839A (en) * 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
WO2000006770A1 (en) * 1998-07-30 2000-02-10 Solexa Ltd. Arrayed biomolecules and their use in sequencing
WO2002061126A2 (en) * 2001-01-30 2002-08-08 Solexa Ltd. The preparation of polynucleotide arrays
WO2002088382A2 (en) * 2001-04-27 2002-11-07 Genovoxx Gmbh Method for analysing nucleic acid chains

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5547839A (en) * 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5302509A (en) * 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
WO1993005183A1 (en) * 1991-09-09 1993-03-18 Baylor College Of Medicine Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme
WO1993021340A1 (en) * 1992-04-22 1993-10-28 Medical Research Council Dna sequencing method
WO2000006770A1 (en) * 1998-07-30 2000-02-10 Solexa Ltd. Arrayed biomolecules and their use in sequencing
WO2002061126A2 (en) * 2001-01-30 2002-08-08 Solexa Ltd. The preparation of polynucleotide arrays
WO2002061127A2 (en) * 2001-01-30 2002-08-08 Solexa Ltd. Arrayed polynucleotides and their use in genome analysis
WO2002088382A2 (en) * 2001-04-27 2002-11-07 Genovoxx Gmbh Method for analysing nucleic acid chains

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TONISSON N ET AL: "UNRAVELLING GENETIC DATA BY ARRAYED PRIMER EXTENSION" CLINICAL CHEMISTRY AND LABORATORY MEDICINE, WALTER DE GRUYTER UND CO, DE, Bd. 38, Nr. 2, 2000, Seiten 165-170, XP001023733 ISSN: 1434-6621 *

Cited By (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7645596B2 (en) 1998-05-01 2010-01-12 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9212393B2 (en) 1998-05-01 2015-12-15 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9096898B2 (en) 1998-05-01 2015-08-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9725764B2 (en) 1998-05-01 2017-08-08 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9957561B2 (en) 1998-05-01 2018-05-01 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US10208341B2 (en) 1998-05-01 2019-02-19 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US10214774B2 (en) 1998-05-01 2019-02-26 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9458500B2 (en) 1998-05-01 2016-10-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9709559B2 (en) 2000-06-21 2017-07-18 Bioarray Solutions, Ltd. Multianalyte molecular analysis using application-specific random particle arrays
US10428380B2 (en) 2000-10-06 2019-10-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10662472B2 (en) 2000-10-06 2020-05-26 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10669577B2 (en) 2000-10-06 2020-06-02 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10457984B2 (en) 2000-10-06 2019-10-29 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10435742B2 (en) 2000-10-06 2019-10-08 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10669582B2 (en) 2000-10-06 2020-06-02 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10570446B2 (en) 2000-10-06 2020-02-25 The Trustee Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9718852B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10407459B2 (en) 2000-10-06 2019-09-10 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10407458B2 (en) 2000-10-06 2019-09-10 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10577652B2 (en) 2000-10-06 2020-03-03 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10633700B2 (en) 2000-10-06 2020-04-28 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10648028B2 (en) 2000-10-06 2020-05-12 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9868985B2 (en) 2000-10-06 2018-01-16 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9725480B2 (en) 2000-10-06 2017-08-08 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9719139B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10415081B2 (en) 2001-10-15 2019-09-17 Bioarray Solutions Ltd. Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
US10519496B2 (en) 2001-12-04 2019-12-31 Illumina Cambridge Limited Labelled nucleotides
US10480025B2 (en) 2001-12-04 2019-11-19 Illumina Cambridge Limited Labelled nucleotides
US9605310B2 (en) 2001-12-04 2017-03-28 Illumina Cambridge Limited Labelled nucleotides
US10513731B2 (en) 2002-08-23 2019-12-24 Illumina Cambridge Limited Modified nucleotides
US10487102B2 (en) 2002-08-23 2019-11-26 Illumina Cambridge Limited Labelled nucleotides
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
US11028116B2 (en) 2003-08-22 2021-06-08 Illumina Cambridge Limited Labelled nucleotides
US10995111B2 (en) 2003-08-22 2021-05-04 Illumina Cambridge Limited Labelled nucleotides
US11028115B2 (en) 2003-08-22 2021-06-08 Illumina Cambridge Limited Labelled nucleotides
US9637777B2 (en) 2003-10-28 2017-05-02 Bioarray Solutions, Ltd. Optimization of gene expression analysis using immobilized capture probes
JP2007509629A (en) * 2003-10-29 2007-04-19 バイオアレイ ソリューションズ リミテッド Complex nucleic acid analysis by cleavage of double-stranded DNA
US7790380B2 (en) 2003-10-29 2010-09-07 Bioarray Solutions, Ltd. Kits for multiplexed nucleic acid analysis by capture of single-stranded DNA produced from double-stranded target fragments
AU2004287069B2 (en) * 2003-10-29 2009-07-16 Bioarray Solutions, Ltd. Multiplexed nucleic acid analysis by fragmentation of double-stranded DNA
EP1694859A4 (en) * 2003-10-29 2007-08-08 Bioarray Solutions Ltd Multiplexed nucleic acid analysis by fragmentation of double-stranded dna
EP1694859A2 (en) * 2003-10-29 2006-08-30 Bioarray Solutions Ltd Multiplexed nucleic acid analysis by fragmentation of double-stranded dna
WO2005044836A2 (en) 2003-11-05 2005-05-19 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
US8637650B2 (en) 2003-11-05 2014-01-28 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
WO2005044836A3 (en) * 2003-11-05 2007-07-19 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
EP1692312A4 (en) * 2003-11-12 2007-10-17 Helicos Biosciences Corp Short cycle methods for sequencing polynucleotides
US9012144B2 (en) 2003-11-12 2015-04-21 Fluidigm Corporation Short cycle methods for sequencing polynucleotides
EP1692312A2 (en) * 2003-11-12 2006-08-23 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US9657344B2 (en) 2003-11-12 2017-05-23 Fluidigm Corporation Short cycle methods for sequencing polynucleotides
US7897345B2 (en) 2003-11-12 2011-03-01 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
WO2005080605A2 (en) * 2004-02-19 2005-09-01 Helicos Biosciences Corporation Methods and kits for analyzing polynucleotide sequences
US7981604B2 (en) 2004-02-19 2011-07-19 California Institute Of Technology Methods and kits for analyzing polynucleotide sequences
WO2005080605A3 (en) * 2004-02-19 2005-11-03 Helicos Biosciences Corp Methods and kits for analyzing polynucleotide sequences
EP2248911A1 (en) * 2004-02-19 2010-11-10 Helicos Biosciences Corporation Methods and kits for analyzing polynucleotide sequences
WO2005116262A1 (en) * 2004-05-24 2005-12-08 Helicos Biosciences Corporation Methods and devices for sequencing nucleic acids
WO2006007207A3 (en) * 2004-05-25 2007-02-22 Helicos Biosciences Corp Methods and devices for nucleic acid sequence determination
WO2006007207A2 (en) * 2004-05-25 2006-01-19 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
US9035035B2 (en) 2004-11-05 2015-05-19 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
US9868978B2 (en) 2005-08-26 2018-01-16 Fluidigm Corporation Single molecule sequencing of captured nucleic acids
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
WO2007100637A2 (en) * 2006-02-22 2007-09-07 Helicos Biosciences Corporation Methods for mutation detection
WO2007100637A3 (en) * 2006-02-22 2007-11-15 Helicos Biosciences Corp Methods for mutation detection
EP4170042A1 (en) 2006-06-14 2023-04-26 Verinata Health, Inc. Methods for the diagnosis of fetal abnormalities
EP2366801A1 (en) 2006-06-14 2011-09-21 Verinata Health, Inc Methods for the diagnosis of fetal abnormalities
EP3406736A1 (en) 2006-06-14 2018-11-28 Verinata Health, Inc Methods for the diagnosis of fetal abnormalities
US9051612B2 (en) 2006-09-28 2015-06-09 Illumina, Inc. Compositions and methods for nucleotide sequencing
US11098353B2 (en) 2006-12-01 2021-08-24 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US11939631B2 (en) 2006-12-01 2024-03-26 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US9670539B2 (en) 2007-10-19 2017-06-06 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US10144961B2 (en) 2007-10-19 2018-12-04 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US11242561B2 (en) 2007-10-19 2022-02-08 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
US10260094B2 (en) 2007-10-19 2019-04-16 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
US11208691B2 (en) 2007-10-19 2021-12-28 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US10174368B2 (en) 2009-09-10 2019-01-08 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US10072287B2 (en) 2009-09-10 2018-09-11 Centrillion Technology Holdings Corporation Methods of targeted sequencing
US11597966B2 (en) 2009-11-06 2023-03-07 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US10329607B2 (en) 2009-11-06 2019-06-25 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US10988804B2 (en) 2009-11-06 2021-04-27 The Board Of Trustees Of The Leland Stanford Junior University Nucleic acid sequencing apparatus for monitoring status of a transplant recipient
US9845497B2 (en) 2009-11-06 2017-12-19 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US10982275B2 (en) 2009-11-06 2021-04-20 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US10494669B2 (en) 2009-11-06 2019-12-03 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US11390918B2 (en) 2009-11-06 2022-07-19 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US10968479B2 (en) 2009-11-06 2021-04-06 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US11098350B2 (en) 2009-11-06 2021-08-24 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US11384389B2 (en) 2009-11-06 2022-07-12 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
EP3719140A1 (en) 2009-11-06 2020-10-07 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US8703652B2 (en) 2009-11-06 2014-04-22 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
WO2011057061A1 (en) 2009-11-06 2011-05-12 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US11634752B2 (en) 2011-01-31 2023-04-25 Roche Sequencing Solutions, Inc. Kit for split-pool barcoding target molecules that are in or on cells or cell organelles
US11939624B2 (en) 2011-01-31 2024-03-26 Roche Sequencing Solutions, Inc. Method for labeling ligation products with cell-specific barcodes II
US11566278B2 (en) 2011-01-31 2023-01-31 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US10626442B2 (en) 2011-01-31 2020-04-21 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11932903B2 (en) 2011-01-31 2024-03-19 Roche Sequencing Solutions, Inc. Kit for split-pool barcoding target molecules that are in or on cells or cell organelles
US11732290B2 (en) 2011-01-31 2023-08-22 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US10144950B2 (en) 2011-01-31 2018-12-04 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11667956B2 (en) 2011-01-31 2023-06-06 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11708599B2 (en) 2011-01-31 2023-07-25 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11512341B1 (en) 2011-01-31 2022-11-29 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11926864B1 (en) 2011-01-31 2024-03-12 Roche Sequencing Solutions, Inc. Method for labeling ligation products with cell-specific barcodes I
US11692214B2 (en) 2011-01-31 2023-07-04 Roche Sequencing Solutions, Inc. Barcoded beads and method for making the same by split-pool synthesis
US11859240B2 (en) 2011-01-31 2024-01-02 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US11932902B2 (en) 2011-01-31 2024-03-19 Roche Sequencing Solutions, Inc. Barcoded beads and method for making the same by split-pool synthesis
US11781171B1 (en) 2011-01-31 2023-10-10 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
US10801062B2 (en) 2011-04-01 2020-10-13 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US9689032B2 (en) 2011-04-01 2017-06-27 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
EP3836149A1 (en) 2011-11-07 2021-06-16 QIAGEN Redwood City, Inc. Methods and systems for identification of causal genomic variants
US10174310B2 (en) 2012-08-08 2019-01-08 Roche Sequencing Solutions, Inc. Increasing dynamic range for identifying multiple epitopes in cells
WO2014026032A2 (en) 2012-08-08 2014-02-13 Apprise Bio, Inc. Increasing dynamic range for identifying multiple epitopes in cells
EP3578669A1 (en) 2012-08-08 2019-12-11 F. Hoffmann-La Roche AG Increasing dynamic range for identifying multiple epitopes in cells
US9910955B2 (en) 2013-02-01 2018-03-06 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US10529443B2 (en) 2013-02-01 2020-01-07 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US11081209B2 (en) 2013-02-01 2021-08-03 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US10825553B2 (en) 2013-02-01 2020-11-03 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
EP3885446A1 (en) 2013-02-01 2021-09-29 The Regents of The University of California Methods for genome assembly and haplotype phasing
US10089437B2 (en) 2013-02-01 2018-10-02 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US11935626B2 (en) 2013-02-01 2024-03-19 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US20170166961A1 (en) 2013-03-15 2017-06-15 Illumina Cambridge Limited Modified nucleosides or nucleotides
US10648026B2 (en) 2013-03-15 2020-05-12 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10407721B2 (en) 2013-03-15 2019-09-10 Illumina Cambridge Limited Modified nucleosides or nucleotides
US11161087B2 (en) 2013-03-15 2021-11-02 Lineage Biosciences, Inc. Methods and compositions for tagging and analyzing samples
US10982277B2 (en) 2013-03-15 2021-04-20 Illumina Cambridge Limited Modified nucleosides or nucleotides
US10722858B2 (en) 2013-03-15 2020-07-28 Lineage Biosciences, Inc. Methods and compositions for tagging and analyzing samples
EP4130350A1 (en) 2013-11-07 2023-02-08 The Board of Trustees of the Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
WO2015070086A1 (en) 2013-11-07 2015-05-14 The Board Of Trustees Of The Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
EP3540074A1 (en) 2013-12-11 2019-09-18 The Regents of the University of California Method of tagging internal regions of nucleic acid molecules
WO2015089243A1 (en) 2013-12-11 2015-06-18 The Regents For Of The University Of California Methods for labeling dna fragments to recontruct physical linkage and phase
US10526641B2 (en) 2014-08-01 2020-01-07 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
EP4219710A2 (en) 2014-08-01 2023-08-02 Dovetail Genomics, LLC Tagging nucleic acids for sequence assembly
US10318706B2 (en) 2015-02-17 2019-06-11 Dovetail Genomics, Llc Nucleic acid sequence assembly
US9715573B2 (en) 2015-02-17 2017-07-25 Dovetail Genomics, Llc Nucleic acid sequence assembly
US11600361B2 (en) 2015-02-17 2023-03-07 Dovetail Genomics, Llc Nucleic acid sequence assembly
US11807896B2 (en) 2015-03-26 2023-11-07 Dovetail Genomics, Llc Physical linkage preservation in DNA storage
US10457934B2 (en) 2015-10-19 2019-10-29 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US10975417B2 (en) 2016-02-23 2021-04-13 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
WO2017197300A1 (en) 2016-05-13 2017-11-16 Dovetail Genomics Llc Recovering long-range linkage information from preserved samples
US10947579B2 (en) 2016-05-13 2021-03-16 Dovetail Genomics, Llc Recovering long-range linkage information from preserved samples
WO2018195091A1 (en) 2017-04-18 2018-10-25 Dovetail Genomics, Llc Nucleic acid characteristics as guides for sequence assembly
WO2018237209A1 (en) 2017-06-21 2018-12-27 Bluedot Llc Systems and methods for identification of nucleic acids in a sample
US11781959B2 (en) 2017-09-25 2023-10-10 Freenome Holdings, Inc. Methods and systems for sample extraction
WO2019152543A1 (en) 2018-01-31 2019-08-08 Dovetail Genomics, Llc Sample prep for dna linkage recovery
US11166996B2 (en) 2018-12-12 2021-11-09 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use
US11446344B1 (en) 2018-12-12 2022-09-20 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use
WO2021103695A1 (en) * 2019-11-25 2021-06-03 齐鲁工业大学 Single-base continuous extension flow-type targeted sequencing method

Also Published As

Publication number Publication date
DE10239504A1 (en) 2003-04-24
AU2002337030A1 (en) 2003-03-18
WO2003020968A3 (en) 2003-12-31

Similar Documents

Publication Publication Date Title
WO2003020968A2 (en) Method for analyzing nucleic acid sequences and gene expression
DE10120797B4 (en) Method for analyzing nucleic acid chains
DE10120798B4 (en) Method for determining gene expression
DE69837913T2 (en) PROCESS FOR THE MAKING OF NUCLEIC ACID
DE69928683T2 (en) PROCESS FOR THE AMPLIFICATION AND SEQUENCING OF NUCLEIC ACIDS
DE10246005A1 (en) Automated nucleic acid sequencer, useful e.g. for analyzing gene expression, based on parallel incorporation of fluorescently labeled terminating nucleotides
DE60208278T2 (en) System and method for testing nucleic acid molecules
DE69233458T2 (en) NUCLEIC ACIDIFYING BY POLYMERASE EXTENSION OF OLIGONUCLEOTIDES USING TERMINATOR MIXTURES
EP1204765B1 (en) Method for relative quantization of methylation of cytosin-type bases in dna samples
DE10214395A1 (en) Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide
DE10149786B4 (en) Surface for studies of populations of single molecules
DE69924140T2 (en) DETERMINATION OF THE LENGTH OF REPETITIVE NUCLEIC ACID SEQUENCES BY A DISCONTINUOUS PRIMER EXTENSION
DE102004025695A1 (en) Optical fluorescent parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
DE102004025694A1 (en) Optical fluorescent ultra-high parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
DE102004025744A1 (en) Surface of a solid support, useful for multiple parallel analysis of nucleic acids by optical methods, having low non-specific binding of labeled components
DE102004025745A1 (en) Surface of solid phase, useful for parallel, optical analysis of many nucleic acids, has reduced non-specific binding of labeled components
DE60038109T2 (en) Method for analyzing AFLP reaction mixtures using primer extension techniques
WO2008080629A2 (en) Improved molecular biological processing system
EP1294946B1 (en) Multiplex sequencing method
WO2003052136A2 (en) Sequencing on perforated membranes
EP1458892B1 (en) Evanescence-based multiplex sequencing method
EP1234056B1 (en) Dynamic determination of analytes using arrays on internal surfaces
DE102004038359A1 (en) Sequencing nucleic acids for e.g. analyzing genomes, comprises contacting nucleic acid-degrading enzymes with free fluorescent labeled nucleic acids, and determining base sequence
DE102006062089A1 (en) Molecular biology process system comprises a device for synthesis of receptor arrays, devices for performing fluidic steps, a detection unit and programmable control units
DE102007018833A1 (en) Molecular-biological processing unit for detection, analysis of genomes, for producing e.g. synthetic nucleic acids, comprises device for in-situ-synthesis of arrays of receptors

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BY BZ CA CH CN CO CR CU CZ DE DM DZ EE ES FI GB GD GE GH GM HU ID IL IN IS JP KE KG KP KR KZ LK LR LS LT LU LV MA MD MG MK MW MX MZ NO NZ PL PT RO RU SD SG SI SK SL TJ TM TR TT TZ UA UG UZ VN YU ZA

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ UG ZM ZW AM AZ BY KG KZ RU TJ TM AT BE BG CH CY CZ DK EE ES FI FR GB GR IE IT LU MC PT SE SK TR BF BJ CF CG CI GA GN GQ GW ML MR NE SN TD TG

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP