logo

Java-merkkiluokka

Character-luokka käärii yleensä kaiken primitiivityypin char arvon objektiksi. Mikä tahansa Character-tyyppinen objekti voi sisältää yhden kentän, jonka tyyppi on char.

Kaikki luokan Character kentät, menetelmät ja rakentajat määritetään Unicode-tietotiedostossa, joka on erityisesti osa Unicode-merkkitietokantaa ja jota Unicode-konsortio ylläpitää.

Merkkijoukko U+0000:sta U+FFFF:ään tunnetaan joskus nimellä Basic Multilingual Plane (eli BMP). Merkkejä, joiden koodipisteet ovat suurempia kuin U+FFFF, kutsutaan lisämerkeiksi. Java-kieli käyttää yleensä UTF-16-koodausmenetelmää merkkijonojen esittämiseen merkkijono- tai merkkijonopuskurissa. Tämän tyyppisessä esitysmuodossa lisämerkit esitetään merkkiparina, joista ensimmäinen on korkealta korvikealueelta (uD800-uDBFF) ja toinen, joka on matalalta korvikealueelta (uDc00- uDBFF).

menetelmät

Menetelmä Kuvaus
charCount(int codePoint) Määrittää tietyn merkin edustamiseen vaadittavien merkkiarvojen määrän.
charValue() Palauttaa annetun Character-objektin arvon.
codePointAt(merkki[]a, int indeksi) Palauttaa annetun taulukon määritetyn indeksin koodipisteen.
codePointAt(merkki[]a, int index, int limit ) Palauttaa char-taulukon koodipisteen määritetyssä indeksissä, jossa käytetään vain taulukon elementtejä, joiden indeksi on määritettyä rajaa pienempi.
codePointAt(CharSequence Seq, int index) Palauttaa koodipisteen määritetyssä indeksissä annetulle CharSequencelle.
codePointBefore(merkki[]a, int index) Palauttaa edellisen indeksin annetun taulukon koodipisteen.
codePointBefore(merkki[]a, int indeksi, int alku) Palauttaa koodipisteen annetulle taulukolle edellisessä indeksissä, jossa käytetään vain taulukon elementtejä, joiden indeksi on suurempi tai yhtä suuri kuin aloitus.
codePointBefore(CharSequence, int index) Palauttaa koodipisteen annetulle CharSequencelle edellisessä indeksissä.
codePointCount(merkki[]a, int offset, int count) Palauttaa Unicode-koodipisteiden kokonaismäärän char array -argumentin annetussa alitaulukossa.
codePointCount(CharSequence Seq, int beginIndex, int endIndex) Palauttaa Unicode-koodipisteiden määrän annetulla tekstialueella määritetylle merkkijonolle.
codePointOf(merkkijonon nimi) Palauttaa CodePoint-arvon tietylle merkin nimelle määritetylle Unicode-merkille.
vertaa (merkki x, merkki y) Vertaa kahta merkkityypin arvoa numeerisesti.
vertailla(merkki toiseen hahmoon) Vertaa kahta merkkityyppistä objektia numeerisesti.
numero (char ch, int kantaluku) Palauttaa määritetyn merkin numeerisen arvon määritetyssä indeksissä.
numero (int codePoint, int kantaluku) Palauttaa annetun merkin numeerisen arvon määritetyllä kantaluvulla.
yhtä kuin (objektiobjekti) Vertaa annettua objektia määritettyyn objektiin.
forDigit(int numero, int kantaluku) Määrittää merkin esityksen tietylle numerolle annetussa kantaluvussa.
getDirectionality(char ch) Palauttaa määritetyn merkin Unicode-suuntausominaisuuden.
getDirectionality(int codePoint) Palauttaa määritetyn koodipisteen Unicode-suuntausominaisuuden.
getName(int codePoint) Palauttaa annetun koodipisteen Unicode-nimen tai voi palauttaa nollan, jos koodipistettä ei ole määritetty.
getNumericValue(char ch) Palauttaa määritetyn Unicode-merkin kokonaislukutyypin arvon.
getNumericValue(int codePoint) Palauttaa määritetyn Unicode-koodipisteen kokonaislukutyypin arvon.
getType (char ch) Palauttaa arvon, joka ilmaisee merkin yleisen luokan.
getType(int codePoint) Palauttaa arvon, joka ilmaisee merkin yleisen luokan.
hash koodin() Palauttaa määritetyn merkin hash-koodin. Tämä menetelmä on yhtä suuri kuin charValue()-menetelmän kutsumisen tulos.
hashcode (merkin arvo) Palauttaa hajautuskoodin tietylle merkkiarvolle.
highSurrogate(int codePoint) Palauttaa tietyn korvikeparin johtavan korvikekoodipisteen, joka edustaa UTF-16-koodauksen lisämerkkiä.
on aakkosellinen (int codePoint) Määrittää, onko annettu merkki aakkoset vai ei.
isBmpCodePoint(int codePoint) Määrittää, onko annettu merkki monikielisessä perustasossa vai ei.
isDefined(char ch) Määrittää, onko merkki määritetty Unicodessa vai ei.
isDefined(int codePoint) Määrittää, onko merkki (Unicode-koodipiste) määritetty Unicodessa vai ei.
isDigit(merkki ch) Määrittää, onko annettu merkki numero vai ei.
isDigit(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) numero vai ei.
isHighSurrogate(merkki ch) Määrittää, ovatko annetut merkkiarvot Unicoden korkea-korvauskoodipiste vai ei.
isIndentifierIgnorable(char ch) Määrittää, pidetäänkö annettua merkkiä huomiotta jätettävänä merkinnä Java-tunnisteessa vai ei.
isIndentifierIgnorable(int codePoint) Määrittää, pidetäänkö annettua merkkiä (Unicode-koodipistettä) Java-tunnisteen ohittamattomana merkkinä vai ei.
isIdeographic(int codePoint) Määrittää, onko määritetty merkki CJKV-ideografia (kiinalainen, japanilainen, korealainen ja vietnamilainen) vai ei.
isISOControl(char ch) Määrittää, onko annettu merkki ISO-ohjausmerkki vai ei.
isISOControl(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) ISO-ohjausmerkki vai ei.
isJavaIdentifierPart(char ch) Määrittää, onko annettu merkki jokin muu Java-tunnisteen osa kuin ensimmäinen merkki vai ei.
isJavaIdentifierPart(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) muu osa Java-tunnistetta kuin ensimmäinen merkki vai ei.
isJavaIdentifierStart(char ch) Määrittää, onko annettu merkki sallittu Java-tunnisteen ensimmäisenä merkkinä vai ei.
isJavaIdentifierStart(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste sallittu Java-tunnisteen ensimmäisenä merkkinä vai ei.
isJavaLetter(char ch) Korvattu isJavaIdentifierStart(char).
isJavaLetterOrDigit(int codePoint) Korvattu isJavaIdentifierPart(char).
isLetter(char ch) Määrittää, onko määritetty merkki kirjain vai ei.
onKirjain(int codePoint) Määrittää, onko määritetty merkki (Unicode-koodipiste) kirjain vai ei.
isLetterOrDigit(char ch) Määrittää, onko määritetty merkki kirjain vai numero vai ei.
onKirjainOrDigit(int codePoint) Määrittää, onko määritetty merkki (Unicode-koodipiste) kirjain vai numero vai ei.
on pieni kirjain(merkki ch) Määrittää, onko määritetty merkki pieni kirjain vai ei.
on pieni kirjain(int codePoint) Määrittää, onko määritetty merkki (Unicode-koodipiste) pieni kirjain vai ei.
onLowSurrogate(char ch) Määrittää, onko annettu merkkiarvo Unicoden matalakorvauskoodiyksikkö vai ei.
on peilattu (merkki ch) Määrittää, onko hahmo peilattu vai ei.
on peilattu(int codePoint) Määrittää, onko merkki (Unicode-koodipiste) peilattu vai ei.
isSpace (merkki ch) Korvattu isWhiteSpace(char ch) -menetelmällä.
isSpaceChar(char ch) Määrittää, onko määritetty merkki Unicode-avaruusmerkki vai ei.
isSupplementaryCodePoint(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) lisämerkkien alueella vai ei.
onSurrogate(merkki ch) Määrittää, onko annettu merkkiarvo Unicode-korvauskoodiyksikkö.
onSurrogatePair (merkki korkea, merkki matala) Määrittää, onko annettu merkkiarvopari kelvollinen Unicode-korvauspari vai ei.
isTitleCase(char ch) Määrittää, onko annettu merkki otsikon kirjainmerkki vai ei.
isTitleCase(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) otsikon kirjainmerkki vai ei.
isUnicodeIdentifierPart(char ch) Määrittää, onko annettu merkki osa Unicode-tunnistetta vai ei.
isUnicodeIdentifierPart(int codePoint) Määrittää, onko annettu merkki (unicofde-koodipiste) osa Unicode-tunnistetta vai ei.
isUnicodeIdentifierStart(char ch) Määrittää, onko annettu merkki sallittu Unicode-tunnisteen ensimmäisenä merkkinä vai ei.
isUnicodeIdentifierStart(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) sallittu Unicode-tunnisteen ensimmäisenä merkkinä vai ei.
iso kirjain(merkki ch) Määrittää, onko annettu merkki iso kirjain vai ei.
iso kirjain(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) iso kirjain vai ei.
isValidCodePoint(int codePoint) Määrittää, onko annettu merkki kelvollinen Unicode-koodipistearvo vai ei.
isWhitespace (char ch) Määrittää, onko annettu merkki välilyönti vai ei.
isWhitespace(int codePoint) Määrittää, onko annettu merkki (Unicode-koodipiste) välilyönti vai ei.
alhainenSurrogate(int codePoint) Palauttaa UTF-16-koodauksen lisämerkkiä edustavan korvikeparin matalan korvikekoodiyksikön (eli loppukorvikkeen).
offsetByCodePoints(merkki[]a, int alku, int count, int indeksi, int codePointOffset) Palauttaa indeksin annetulle merkkialiryhmälle, joka on codePointOffset-koodipisteiden siirtymä annetusta indeksistä.
offsetByCodePoints(CharSequence Seq, int-indeksi, int codePointOffset) Palauttaa indeksin annetulle merkkialiryhmälle, joka on codePointOffset-koodipisteiden siirtymä annetusta indeksistä.
reverseBytes (char ch) Palauttaa arvon, joka on saatu vaihtamalla annettujen tavujen järjestys määritetyissä merkkiarvoissa.
toChars(int codePoint) Muuntaa määritetyn merkin (Unicode-koodipisteen) sen UTF-16-esitykseen, joka on tallennettu merkkijonoon.
toChars(int codePoint, char[] dst, int dstIndex) Muuntaa määritetyn merkin (Unicode-koodipisteen) sen UTF-16-esitykseen.
toCodePoint(merkki korkea, merkki matala) Muuntaa annetun korvikeparin sitä vastaavaksi lisäkoodipistearvoksi.
pienet kirjaimet (char ch) Muuntaa merkkityyppiargumentin pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainten kartoitustietoja.
pienet kirjaimet (int codePoint) Muuntaa merkkityypin argumentin (Unicode-koodipisteen) pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja.
toString() Palauttaa merkkijonotyyppisen objektin, joka edustaa merkin arvoa.
toString(merkki ch) Palauttaa merkkijonotyyppisen objektin, joka edustaa määritettyä merkkiä
toTitleCase(char ch) Muuntaa merkkityypin argumentin otsikon kirjainkoolla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja.
toTitleCase(int codePoint) Muuntaa merkkityypin argumentin (Unicode-koodipisteen) pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja.
isot kirjaimet (char ch) Muuntaa merkkityypin argumentin isoiksi käyttämällä Unicode-datatiedostosta saatuja kirjainkoon yhdistämistietoja.
isot kirjaimet (int codePoint) Muuntaa merkkityypin argumentin (Unicode-koodipisteen) isoiksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja.
arvo(merkki c) Palauttaa merkin esiintymän, joka edustaa määritettyä merkin arvoa.

Esimerkki 1

 import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+'
'); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+'
'); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } } 

Lähtö:

 Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false 

Esimerkki 2

 public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = '
'; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } } 
Testaa nyt

Lähtö:

 The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true