Character-luokka käärii yleensä kaiken primitiivityypin char arvon objektiksi. Mikä tahansa Character-tyyppinen objekti voi sisältää yhden kentän, jonka tyyppi on char.
Kaikki luokan Character kentät, menetelmät ja rakentajat määritetään Unicode-tietotiedostossa, joka on erityisesti osa Unicode-merkkitietokantaa ja jota Unicode-konsortio ylläpitää.
Merkkijoukko U+0000:sta U+FFFF:ään tunnetaan joskus nimellä Basic Multilingual Plane (eli BMP). Merkkejä, joiden koodipisteet ovat suurempia kuin U+FFFF, kutsutaan lisämerkeiksi. Java-kieli käyttää yleensä UTF-16-koodausmenetelmää merkkijonojen esittämiseen merkkijono- tai merkkijonopuskurissa. Tämän tyyppisessä esitysmuodossa lisämerkit esitetään merkkiparina, joista ensimmäinen on korkealta korvikealueelta (uD800-uDBFF) ja toinen, joka on matalalta korvikealueelta (uDc00- uDBFF).
menetelmät
| Menetelmä | Kuvaus |
|---|---|
| charCount(int codePoint) | Määrittää tietyn merkin edustamiseen vaadittavien merkkiarvojen määrän. |
| charValue() | Palauttaa annetun Character-objektin arvon. |
| codePointAt(merkki[]a, int indeksi) | Palauttaa annetun taulukon määritetyn indeksin koodipisteen. |
| codePointAt(merkki[]a, int index, int limit ) | Palauttaa char-taulukon koodipisteen määritetyssä indeksissä, jossa käytetään vain taulukon elementtejä, joiden indeksi on määritettyä rajaa pienempi. |
| codePointAt(CharSequence Seq, int index) | Palauttaa koodipisteen määritetyssä indeksissä annetulle CharSequencelle. |
| codePointBefore(merkki[]a, int index) | Palauttaa edellisen indeksin annetun taulukon koodipisteen. |
| codePointBefore(merkki[]a, int indeksi, int alku) | Palauttaa koodipisteen annetulle taulukolle edellisessä indeksissä, jossa käytetään vain taulukon elementtejä, joiden indeksi on suurempi tai yhtä suuri kuin aloitus. |
| codePointBefore(CharSequence, int index) | Palauttaa koodipisteen annetulle CharSequencelle edellisessä indeksissä. |
| codePointCount(merkki[]a, int offset, int count) | Palauttaa Unicode-koodipisteiden kokonaismäärän char array -argumentin annetussa alitaulukossa. |
| codePointCount(CharSequence Seq, int beginIndex, int endIndex) | Palauttaa Unicode-koodipisteiden määrän annetulla tekstialueella määritetylle merkkijonolle. |
| codePointOf(merkkijonon nimi) | Palauttaa CodePoint-arvon tietylle merkin nimelle määritetylle Unicode-merkille. |
| vertaa (merkki x, merkki y) | Vertaa kahta merkkityypin arvoa numeerisesti. |
| vertailla(merkki toiseen hahmoon) | Vertaa kahta merkkityyppistä objektia numeerisesti. |
| numero (char ch, int kantaluku) | Palauttaa määritetyn merkin numeerisen arvon määritetyssä indeksissä. |
| numero (int codePoint, int kantaluku) | Palauttaa annetun merkin numeerisen arvon määritetyllä kantaluvulla. |
| yhtä kuin (objektiobjekti) | Vertaa annettua objektia määritettyyn objektiin. |
| forDigit(int numero, int kantaluku) | Määrittää merkin esityksen tietylle numerolle annetussa kantaluvussa. |
| getDirectionality(char ch) | Palauttaa määritetyn merkin Unicode-suuntausominaisuuden. |
| getDirectionality(int codePoint) | Palauttaa määritetyn koodipisteen Unicode-suuntausominaisuuden. |
| getName(int codePoint) | Palauttaa annetun koodipisteen Unicode-nimen tai voi palauttaa nollan, jos koodipistettä ei ole määritetty. |
| getNumericValue(char ch) | Palauttaa määritetyn Unicode-merkin kokonaislukutyypin arvon. |
| getNumericValue(int codePoint) | Palauttaa määritetyn Unicode-koodipisteen kokonaislukutyypin arvon. |
| getType (char ch) | Palauttaa arvon, joka ilmaisee merkin yleisen luokan. |
| getType(int codePoint) | Palauttaa arvon, joka ilmaisee merkin yleisen luokan. |
| hash koodin() | Palauttaa määritetyn merkin hash-koodin. Tämä menetelmä on yhtä suuri kuin charValue()-menetelmän kutsumisen tulos. |
| hashcode (merkin arvo) | Palauttaa hajautuskoodin tietylle merkkiarvolle. |
| highSurrogate(int codePoint) | Palauttaa tietyn korvikeparin johtavan korvikekoodipisteen, joka edustaa UTF-16-koodauksen lisämerkkiä. |
| on aakkosellinen (int codePoint) | Määrittää, onko annettu merkki aakkoset vai ei. |
| isBmpCodePoint(int codePoint) | Määrittää, onko annettu merkki monikielisessä perustasossa vai ei. |
| isDefined(char ch) | Määrittää, onko merkki määritetty Unicodessa vai ei. |
| isDefined(int codePoint) | Määrittää, onko merkki (Unicode-koodipiste) määritetty Unicodessa vai ei. |
| isDigit(merkki ch) | Määrittää, onko annettu merkki numero vai ei. |
| isDigit(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) numero vai ei. |
| isHighSurrogate(merkki ch) | Määrittää, ovatko annetut merkkiarvot Unicoden korkea-korvauskoodipiste vai ei. |
| isIndentifierIgnorable(char ch) | Määrittää, pidetäänkö annettua merkkiä huomiotta jätettävänä merkinnä Java-tunnisteessa vai ei. |
| isIndentifierIgnorable(int codePoint) | Määrittää, pidetäänkö annettua merkkiä (Unicode-koodipistettä) Java-tunnisteen ohittamattomana merkkinä vai ei. |
| isIdeographic(int codePoint) | Määrittää, onko määritetty merkki CJKV-ideografia (kiinalainen, japanilainen, korealainen ja vietnamilainen) vai ei. |
| isISOControl(char ch) | Määrittää, onko annettu merkki ISO-ohjausmerkki vai ei. |
| isISOControl(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) ISO-ohjausmerkki vai ei. |
| isJavaIdentifierPart(char ch) | Määrittää, onko annettu merkki jokin muu Java-tunnisteen osa kuin ensimmäinen merkki vai ei. |
| isJavaIdentifierPart(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) muu osa Java-tunnistetta kuin ensimmäinen merkki vai ei. |
| isJavaIdentifierStart(char ch) | Määrittää, onko annettu merkki sallittu Java-tunnisteen ensimmäisenä merkkinä vai ei. |
| isJavaIdentifierStart(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste sallittu Java-tunnisteen ensimmäisenä merkkinä vai ei. |
| isJavaLetter(char ch) | Korvattu isJavaIdentifierStart(char). |
| isJavaLetterOrDigit(int codePoint) | Korvattu isJavaIdentifierPart(char). |
| isLetter(char ch) | Määrittää, onko määritetty merkki kirjain vai ei. |
| onKirjain(int codePoint) | Määrittää, onko määritetty merkki (Unicode-koodipiste) kirjain vai ei. |
| isLetterOrDigit(char ch) | Määrittää, onko määritetty merkki kirjain vai numero vai ei. |
| onKirjainOrDigit(int codePoint) | Määrittää, onko määritetty merkki (Unicode-koodipiste) kirjain vai numero vai ei. |
| on pieni kirjain(merkki ch) | Määrittää, onko määritetty merkki pieni kirjain vai ei. |
| on pieni kirjain(int codePoint) | Määrittää, onko määritetty merkki (Unicode-koodipiste) pieni kirjain vai ei. |
| onLowSurrogate(char ch) | Määrittää, onko annettu merkkiarvo Unicoden matalakorvauskoodiyksikkö vai ei. |
| on peilattu (merkki ch) | Määrittää, onko hahmo peilattu vai ei. |
| on peilattu(int codePoint) | Määrittää, onko merkki (Unicode-koodipiste) peilattu vai ei. |
| isSpace (merkki ch) | Korvattu isWhiteSpace(char ch) -menetelmällä. |
| isSpaceChar(char ch) | Määrittää, onko määritetty merkki Unicode-avaruusmerkki vai ei. |
| isSupplementaryCodePoint(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) lisämerkkien alueella vai ei. |
| onSurrogate(merkki ch) | Määrittää, onko annettu merkkiarvo Unicode-korvauskoodiyksikkö. |
| onSurrogatePair (merkki korkea, merkki matala) | Määrittää, onko annettu merkkiarvopari kelvollinen Unicode-korvauspari vai ei. |
| isTitleCase(char ch) | Määrittää, onko annettu merkki otsikon kirjainmerkki vai ei. |
| isTitleCase(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) otsikon kirjainmerkki vai ei. |
| isUnicodeIdentifierPart(char ch) | Määrittää, onko annettu merkki osa Unicode-tunnistetta vai ei. |
| isUnicodeIdentifierPart(int codePoint) | Määrittää, onko annettu merkki (unicofde-koodipiste) osa Unicode-tunnistetta vai ei. |
| isUnicodeIdentifierStart(char ch) | Määrittää, onko annettu merkki sallittu Unicode-tunnisteen ensimmäisenä merkkinä vai ei. |
| isUnicodeIdentifierStart(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) sallittu Unicode-tunnisteen ensimmäisenä merkkinä vai ei. |
| iso kirjain(merkki ch) | Määrittää, onko annettu merkki iso kirjain vai ei. |
| iso kirjain(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) iso kirjain vai ei. |
| isValidCodePoint(int codePoint) | Määrittää, onko annettu merkki kelvollinen Unicode-koodipistearvo vai ei. |
| isWhitespace (char ch) | Määrittää, onko annettu merkki välilyönti vai ei. |
| isWhitespace(int codePoint) | Määrittää, onko annettu merkki (Unicode-koodipiste) välilyönti vai ei. |
| alhainenSurrogate(int codePoint) | Palauttaa UTF-16-koodauksen lisämerkkiä edustavan korvikeparin matalan korvikekoodiyksikön (eli loppukorvikkeen). |
| offsetByCodePoints(merkki[]a, int alku, int count, int indeksi, int codePointOffset) | Palauttaa indeksin annetulle merkkialiryhmälle, joka on codePointOffset-koodipisteiden siirtymä annetusta indeksistä. |
| offsetByCodePoints(CharSequence Seq, int-indeksi, int codePointOffset) | Palauttaa indeksin annetulle merkkialiryhmälle, joka on codePointOffset-koodipisteiden siirtymä annetusta indeksistä. |
| reverseBytes (char ch) | Palauttaa arvon, joka on saatu vaihtamalla annettujen tavujen järjestys määritetyissä merkkiarvoissa. |
| toChars(int codePoint) | Muuntaa määritetyn merkin (Unicode-koodipisteen) sen UTF-16-esitykseen, joka on tallennettu merkkijonoon. |
| toChars(int codePoint, char[] dst, int dstIndex) | Muuntaa määritetyn merkin (Unicode-koodipisteen) sen UTF-16-esitykseen. |
| toCodePoint(merkki korkea, merkki matala) | Muuntaa annetun korvikeparin sitä vastaavaksi lisäkoodipistearvoksi. |
| pienet kirjaimet (char ch) | Muuntaa merkkityyppiargumentin pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainten kartoitustietoja. |
| pienet kirjaimet (int codePoint) | Muuntaa merkkityypin argumentin (Unicode-koodipisteen) pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja. |
| toString() | Palauttaa merkkijonotyyppisen objektin, joka edustaa merkin arvoa. |
| toString(merkki ch) | Palauttaa merkkijonotyyppisen objektin, joka edustaa määritettyä merkkiä |
| toTitleCase(char ch) | Muuntaa merkkityypin argumentin otsikon kirjainkoolla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja. |
| toTitleCase(int codePoint) | Muuntaa merkkityypin argumentin (Unicode-koodipisteen) pieniksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja. |
| isot kirjaimet (char ch) | Muuntaa merkkityypin argumentin isoiksi käyttämällä Unicode-datatiedostosta saatuja kirjainkoon yhdistämistietoja. |
| isot kirjaimet (int codePoint) | Muuntaa merkkityypin argumentin (Unicode-koodipisteen) isoiksi kirjaimilla käyttämällä Unicode-datatiedostosta saatuja kirjainkoon kartoitustietoja. |
| arvo(merkki c) | Palauttaa merkin esiintymän, joka edustaa määritettyä merkin arvoa. |
Esimerkki 1
import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+'
'); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+'
'); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } } Lähtö:
Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false
Esimerkki 2
public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = '
'; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } } Testaa nyt Lähtö:
The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true