言語地理学のへや(福嶋秩子)

 

言語データファイルの作製について:

EXCELで作ったファイルを利用する場合の注意点

・・2001/6/1 作成・・

 

 言語地理学的調査データをEXCELで入力し、それをSEAL用の言語データファイル(拡張子.dbs)に作りかえる場合、次のような点で注意が必要である。

 

(1)元のEXCELファイルの例

 各言語項目につき、1列を使っている。そのため、併用は一つのセルに入っている。

地点No 地点名 項目1 項目2 項目3 項目4 項目5
    1 新潟市    1    1    1
    2 白根市    1 カラ 二、カラ   1 1,2
    3 亀田町    2 カラ        1
    4 新津市    2 カラ カラ   1    1
    5 豊栄市    1   1    1





 

 以下略

 

(2).dbsファイルの原型をEXCEL上につくる

 まず、1言語項目ごとの.dbsファイルの原型をEXCELの一つのSHEET上に作る。以下がその例である。「50」は地点数、「katta」はファイル名、「買った」は言語項目名、「1=katta 2=ko:ta」はコメント(この場合は語形をそのまま入力するかわりに数字で入力したので、その対照を示した)、1列目の1は併用数、2列目の1は言語データを数字であらわしたものである。ただし、報告書のp.24に示した例と違い、2行目の第2列目のセルにコメントを入力している。このようにしないと、あとで示すように不適正なCSVファイルができる。

50 katta   
買った 1=katta 2=ko:ta     
    1       
    1         
    1      
    1      
    1      






 

 以下略

 

 報告書のp.24では、次のようにコメントを3行目の2列目のセルにおいた。このように入力すると、CSVファイルとして保存したときに、「買った」と「1=katta 2=ko:ta」のあとに、それぞれカンマ(,)が入力されてしまい、空白セルがあると見なされてしまう。

50 katta   
買った     
1=katta 2=ko:ta      
    1    1      



 
 

(3).dbsファイルの原型に言語データをコピーする

 次に、3行目2列目のセルから下に、最初に示したEXCEL上の表の言語データ(2行目以下、総地点数分)をコピーする。そうすると、このようになる。

50 katta   
買った 1=katta 2=ko:ta     
    1    1      
    1    1        
    1    2     
    1    1     
    1    1     






 

 以下略

 

(4)CSVファイルとして保存する

 ここで、「ファイル」−「名前をつけて保存」を選ぶ。ファイル名をkattaとし、ファイルの種類を「CSV(カンマ区切り)」とすると、katta.csvとして保存できる。次に、エクスプロラで、このファイルを見つけ、右クリックして「名前の変更」をえらび、拡張子を.dbsに変更する。通常、これでSEAL用の言語データファイルとして通用するはずである。

 エディターなどでこのファイルをのぞいてみると次のようになっている。

 

50,katta

買った,1=katta 2=katta

1,1
1,1
1,2
1,1
1,1
 以下略
 
 文字列データは通常" "で囲まれるが、なくてもいいようだ。ただし、以下の例のように、セルのデータの中でカンマ(,)を使ったときは、CSV保存したときに自動的に" "で囲まれる。
 

50,katta

買った,"1=katta, 2=katta"

1,1
 

(5)タブ区切りのテキストファイルとして保存する

 EXCELでは、タブ区切りのテキストファイルとして保存し、それを.dbsファイルに改名して言語データファイルとして利用することもできるが、以下のようないくつかの制限がある。
 1. セルのデータ中でカンマ(,)を使っていると、そこで、データがきれていると見なされる。エディターの検索・置換機能を使って、すべてのカンマを全角の読点(、)あるいはスペースに変更しておく必要がある。
 
1 wa,ga          >    1 wa、ga    または wa ga
1 wa               1 wa
 
 2. 言語データとして、何も入力されていないとき、CSVファイルはデータなしとして
扱うが、タブ区切りテキストファイルでは、エラーとなる。エディターで読み込んで、言語データなしの部分をさがし、NR(No responseの意)などを追加しておく必要がある。

 

1 wa              1 wa
1             >    1 NR

 


インターネット共同研究報告 福嶋秩子

言語地理学のへや にもどる

福嶋研へようこそ にもどる

Home page of Niigata Women's College