设为首页 | 加入收藏 | 旧版回顾 | 王氏网论坛

世界王氏宗亲联谊交流寻根恳亲繁荣文化发展商企唯一官方门户网站

江汇泉答复王春旭对族谱数据标准化之意见

2014-10-11 07:09:44来源:大族谱协会

打印 字号: T|T

江汇泉近照
 
王春旭先生:
您好,根据您的回应,我回复如下(同样地,为了方便其他宗亲同好参与讨论,我把您回应我的附件文档同时附上并抄送其他人):
“某人有多个别名或乳名-可以这样表示 姓名(别名, 别名) .-以逗号隔开.”——对于计算机来讲,所有规则性的做法,它都视为“正确”的。这种“正确”,并不是我们通知理解的语义正确,但是,由于其有规则,所以都可以转换成另外一种规则从而更好透露正确的语义或更好的表达。所以,只要坚持规则的做法,做了肯定比不做好——因为这起码相当于一次初加工,条件允许的话,再作规范是会节省成本的(关于您这个XLS格式家谱的转换可能,后面我会再作分析)。

“一般上,旧家谱所列的地名都是当时已存在旧地名,经历多次改朝换代,土地之重新规划.今天地图无法查出,唯有以现新地名概括当时的地理位置,加強读者认知感.”——非常赞同这种观点。我们信息化的目的,就是通过合理的整理信息,更好地揭示信息、更好地方便查询。所以,如果条件允许,在数据中表达新旧地点甚至某位宗亲工作或居住过的多个地点,肯定是多多益善。当然,有得必有失,数据信息量大,然会加大数据收集整理工作量成本。甚至,如果信息系统设计者如果没有好的框架设计,对于这些似是而非,既有相同点又有差异性的信息来说,信息越大,越容易引起混淆或混乱。正好,我的专业就是研究这方面的,所以相信一定会给各位在处理这类信息方面提供合理、有益的意见与指导的。我的意思是,请放心,相对您这类需求,一定会提供很好的应用解决方案的,比如,信息查询者在不知道到底是那种地点时,总而统之,按地点查询能找到数据;同样地,信息查询者如果知道更具体的地点类型进行查询时,可以实现更专指、更精确的查询以找到数据。同时,在信息录入或搜集时,如果我们从传承下来的家谱文献中,看到的地点暂不确定它是否是已失效的古地点时,我们也可以直接在地名字段中照书实录。不用耗精费神先考证出新旧地名后再录入,这样就可以提高数据录入与整理效率,且这种数据入库后,即可起到查询、形成谱系或谱表等效果。然而,我们可以另寻他人或它时慢慢考证新旧地名,再回到系统中对之前宽泛的地名添加限制说明,以表达其是新还是旧等效果,这都不会影响大局,即体现出循序渐进的信息管理效果。甚至,在图书馆界,一直有“规范库”的应用实践和相应成果。那么,在家谱系统中,也考虑引入“地名”、“时代”、“人名”规范体系的话,就可以通过继承图书馆现有的规范数据,再结合我们家谱信息采集者的动态增补、维护,就能更好起到数据规范,保障更正确、更高效率标注新旧地名、时代等(时代或时间的规范,才能保证诸如按生卒时间查询出相关宗亲的效果)。

“原籍 以早期先祖迁居地为主导
祖籍 以近现代之居住地名为主导.
祖籍与原籍:意义上同等.其差别性在于时间上.
通常一个家族因战乱、天災、移民而遷徙一处又一处,每一次都涉及肇基始祖、迁居始祖、渡琼始祖等等、而移居海外者皆为开基(始)祖. 这呈現了某一家族的移民史. 原有地名与现地名或多或少有所不同, 把两者都列入家谱内, 让后代子孙可循此追祖(地)寻根.”——同上分析,从技术与管理思路来讲,您这种不同地点表达的语义不同,我们已胸有成竹足以应对。所以,对于您们这种家谱文化研究者和传承者来讲,只要愿意,尽管把自己认为很重要的信息找出来,交给系统或数据库建设者,他们是能给您找到存贮位置的。注意,每个人都有自己的理解与侧重,所以即便其他人认为用不着这么细致或没有精力与成本这么细致,他可以简单化、忽略则不,跟您追求细致在我思考的框架与体系中是不冲突的。

“世代年份不能硬行规定,首位早婚者之世代间隔缩短,遲婚者世代则延长.從旧谱同宗族辉上依各个世代份间隔可以获取一个概括性平均年,即隔多少年才能算一世代.但每支家族的世代皆不相同.基本大概分二、三十年或为一代.”
——由于我没有认真研究过家谱文化,所以我不敢就“世代年份”乱发表评论。我之前理解的“世代”,以为是诸如某人是某人第几代孙,这个“几”字,就是其世代呢。所以照我的这个理解,完全可以忽略这些传承人物是否高寿或是否“幺房出长辈”,因为这个排位,是根据人与人之前的直系间隔而非时间年龄由算机分析汇总并呈现的。
世代: 根据人与人之前的直系间隔,非常正确. 而世代间之若干年只是一般的估计数,可以预计世代间可能出现的错误.僻如世代间超出百年,这是不正常的现象.

“出继与入继,对旧时宗法社会非常重视.重修旧谱应依旧记录保留下来. 但现代社会对此也开始漠糊了,尤以星马一带,某同宗的子孙过继给无嗣的长辈,是当无嗣长辈过世时才决定谁来拿香火炉,过后家谱上也沒有真实记录下来.”
——每个家谱文化的践行者,都愿意向外界发出呼吁,希望更多人重视并收集整理自己认为重要的内容。从逻辑角度和平等,我非常认可入继与出继的人物都得重视。且从技术角度,无论出继还是入继,他们都是一条人物数据而已,只要做好相关标记。那么,在数据库数据中,即便出继者,也一样有其后代关联人物信息(如果有子嗣的)。然后,如果某宗亲比较传统等原因,认为形成的谱系中,不应该考虑这个出继者的一脉,那么,系统是很容易通过这个标记,把他及其子脉忽略。反之,随时可以把其子脉呈现出来。这就是谱系系统比传统家谱、比您现在这种XLS表格电子家谱强大的地方之一。谱系系统比传统家谱更能呈现 “入继与出继”-这是肯定的

“xls(Excel)建家谱格式,是我自撑握了手写中文(大约2008年左右),才开始以xls把我渡琼始祖王琼公之海南王氏家谱,全套20多本重新以Microsoft Excel(xls)格式编写,经多次修改才渐完成.由于xls 建谱格式缺乏ID,我非常希望高手们能编辑筒单软件,把我这xls 建谱格式转换而被纳入PGV 兼容范囲内. 目前,当PGV正式纳入规范工作之前, 大家可以先利用这xls格式,由自己开始,简单地建立自己移居地开基祖的家谱(最多三代至六代暫保存下来.这过程简易不复什,略识电脑人士皆能上手 – 真所谓“修建家谱 由您开始”。
我之所以呈上建谱格式,主要其内含一些修建家谱基本要求与关系,供大家交流.又xls具有寻找功TRL+F=Search),只要填上中文名字,它就能把所要找的人士列出所在位置,包括同名者.谱上寻根就轻而易己.”
——是的,很钦佩您这种静得下心来整理中华传统文化的学者。所以,之前受限于对计算机化或信息化重要性理解不足,采用了XLS这种简单化的计算机文件方式整理或录入家谱。确实没有一步到位。并且,我初步查看了一下,像您这种XLS格式,粗粗看起也算有规则,比如从列可以看出各“世代”,所以,很容易区分上一代人与下一代人。同时,如果有子嗣,那么通过将相邻一格之下边框加粗,再把后一格之左边框加粗以标其直系。理论上说,只要您能保证都是按这种规则建的谱(比如都是这样表达直系,且都有一列表达兄弟排行),那么,是可以通过各种判断实现数据提取的(您表格中的红字标注因其没规则,所以无法转换)。
不知您这样制作的内容中,大约含有多少人物数据?如果仅几万人,我建议日后直接在更好用的数据库系统中逐条创建而不用通过转换实现——因为分析这种复杂的表格并编辑转换程序的成本也是不小的,比如有一万元人民币的成本,那么还不如由人工对照您这个文件,逐条录入——根据我在图书馆接触到的编制目录数据经验,一个熟练的计算机打字人员,照着录入您这个文件中人物的信息,一个人一天工作量起码可以建800条左右。那么,一个月也就能完成两万多的数据录入了。所以,数据转换程序的编制,一是针对数据量大的已有数据,二是针对单条数据中,信息量大(内容多)的,才合算。
从您发来的这个电子表格文件设计的规整与细致也可以看出,您应该是个非常认真仔细的人。但再认真的人,大枯燥大量的数据输入中,由于没有更科学的查错机制,所以真不敢保证在某个节点因手误疏忽,导致漏标了某个标记或标记错误。那么,计算机这种“一根筋”,会忠实按预置逻辑判断转换,转换来的反而是错误的东西了。
当DZP的PGV发佈之前,只靠我的xls作为初步的试点子.比较适合小家庭的三、四代家谱输入.当然PGV是完整的建谱谱系系统,内部已具备许多基本统计系列,依已输入资料自动计算出统计学数据与各类谱系展示图.“
 
对于旧谱,由于不确定生年或记录错误(我也曾发现兄弟生年对掉),由于年代已久,无法确定,只暂保留,不作任何修改.”
——在图书馆书目数据建设中,也有类似的情况。录入人员因为长期单调的工作折磨,有时候是机械反应,不会仔细核对具体信息内容。类似把生卒年录入反了都是可能的。但只要数据进入系统,诸如这种生年与卒年弄反了、兄出生在弟后的矛盾地方,系统是很容易编些查错规则后续把它们找出来供核查纠错的。所以,条件不成熟或现有数据转换中,完全可以带错入库,日后我们再通过程序查纠错(效率高得不得了)。
PGV内加上 “程序查纠错”, 自动纠错,那太好了.
“我这里再提出一考妣葬地问题:
由于社会之发展,土地之开拓,城市之建设,大量的葬地渐渐被侵蚀,坦然无存,旧谱记载的葬地无法寻回.形成寻根可能的断層,旧谱一如既往留给我们点点滴滴的追思.尚存留的迁居祖墳地显然大家应加以保护.城市之扩建,影响墳地之迁移或火化为骨灰存放于骨灰㟷、庙堂、教堂,也应记录新修谱内,祖先仍然为我们所追念.—数典不忘祖也。”
——如前所述,您很关注这些信息,肯定有其合理性与价值。所以,只要您愿意,我认为系统不应该拒绝这些信息的表达。我会考虑在“地点”这个描述大框架中,提议增加诸如“葬地”这样的修饰词限制的——如果有描述需求,就可以在通过“葬地”限定的“地点”这个描述主元素中表达考妣葬地的。所谓限定,是对描述主元素的一种性质、作用等的更精准约束。好比我们都可以作为“人”进行描述。但条件成熟或事后有需求时,就可以把某个“人”后打个括号,在括号中标记“好”或“坏”了,即表达这个人,是好人还是坏人的意思。但搞不清楚他是好还是坏时,直接按人进行查询,还是会找到他的。我仅是为了方便大家理解,所以如此举例。这些概念体现在数据规范与结构化表达后,会更简练的。
您说的一点沒错!

致礼
 
江汇泉


谢谢江汇泉先生再一次的指导.
这里再提PGV谱系公开上网与隱私问题:
由于全球化,华人分布各地,加上中国人口超越13亿.囯图与协会应统一规范,而各个姓氏组职或会馆必需安排对各自姓氏个别成员,通过ID和密码上网搜索自己所属支派家谱,同时允许他们添加新成员(包括子女、婚…..).对上两代只能作某种修改(如近亲死亡…).
至于隱私问题: 唯有当事人向自已姓氏组职或会館特别要求提出而作出安排.这就是各个姓氏组职或会館自行菅理各自的家谱(宗谱)系统之好处.
王春旭上
 
 
编 辑:wangshi 标签:
相关文章